OpenAI, ChatGPT 사용자에게 더 빠른 언어 모델을 무료로 출시(GPT-4o)
▶ OpenAI, ChatGPT 사용자에게 더 빠른 언어 모델을 무료로 출시함
- 신규 언어 모델 : GPT-4o
- 응답 시간 : 232 밀리초(오디오 입력에 응답) → 평균 시간(320 밀리초, 인간의 응답 시간과 비슷함)
- API : 훨씬 빠르면서 50% 저렴해짐
- 언어 토큰화(20개 언어 선택) : 구자라트어, 텔루구어, 타밀어, 마라티어, 힌디어, 우르드어, 아랍어, 페르시아어, 러시아어, 한국어, 베트남어, 중국어, 일본어, 터키어, 이탈리아어, 독일어, 스페인어, 포르투갈어, 프랑스어, 영어
- 음성 모드 사용(이전) : 평균 시간(GPT-3.5, 2.8초 / GPT-4, 5.4초)의 지연시간으로 ChatGPT와 대화가 가능함
- 음성 모드(목표 달성) : 3가지 개별 모델 파이프라인(오디오 → 텍스트 / GPT3.5 혹은 GPT-4를 텍스트로 가져와서 출력 / 해당 텍스트를 다시 오디오로 변환)
① 텍스트 평가
★ 참고
- 이러한 모든 평가는 새로운 단순 평가(새 창에서 열림) 라이브러리를 통해 수집되었음
- 또한 기존 5샷 no-CoT MMLU에서 GPT-4o는 87.2%라는 새로운 최고 점수를 설정함
※ 참고 : Llama-3(4,000억개 매개변수)는 현재 훈련 중입니다.)
② 오디오 ASR 성능
③ 오디오 번역 성능
- 때로 그림과 다이어그램을 포함하는 다른 국가의 표준화된 테스트의 객관식 질문으로 구성된 다국어 및 비전 평가임입니다.
- 스와힐리어와 자바어에 대한 비전 결과는 생략함
(이러한 언어에 대한 비전 질문은 5개 이하이기 때문)
⑤ 비전 이해 평가
- 시각적 인식 벤치마크에서 최첨단 성능을 달성함
- 딥 러닝의 한계를 뛰어넘는 최신 단계(실용적 사용성을 지향함)
- 2년 기간(스택의 전체 계층) : 효율성 개선을 위해서 많이 노력함
- 반복적 출시(GPT-4o) : 기능이 반복적으로 출시될 예정(오늘부터 확장된 레드팀 액세스 포함)
- ChatGPT 출시 : 무료 계층(GPT-4o 모델을 사용이 가능함) / 플러스 계층(최대 5배 더 높은 메세지 제한을 제공)
회연결