GPT-4 모의 시험에서 우수한 주니어 및 훈련생 안과 의사
11123124123
70 0 0
해외 기사를 번역기로 번역 하였습니다 오역이 있을수 있으니 원문을 참고 하세요
새로운 연구에 따르면 GPT-4 와 같은 LLM (대형 언어 모델 ) 이 안과 분야에서 미래를 가질 수 있지만 한계와 위험은 여전히 남아 있습니다. 캠브리지 대학의 연구원들은 모의 시험에서 인간 안과 의사를 대상으로 다른 LLM과 함께 GPT-4를 테스트했습니다.
GPT-4는 시험에서 87개 질문 중 60개를 올바르게 답했습니다.
결과는 흥미로웠습니다. GPT-4는 87개 문항 중 60개를 정확하게 답해 수련의사(평균 59.7점)와 후배의사(평균 37점)를 능가했다. 하지만 전문 안과의사가 달성한 평균 점수(66.4점)에는 미치지 못했다. PaLM 2 및 GPT-3.5 와 같은 다른 LLM은 덜 인상적이었습니다.
이러한 발견은 잠재적인 이점을 암시하지만 연구자들은 상당한 위험을 강조합니다. 이 연구의 제한된 질문 풀은 일반화 가능성에 대한 우려를 불러일으킵니다. 더 중요한 것은 법학 석사는 백내장이나 암과 같은 심각한 질환에 대한 오진으로 이어질 수 있는 정보를 조작하는 "환각"에 취약하다는 것입니다. 또한 LLM 고유의 뉘앙스 부족으로 인해 부정확성이 더욱 악화될 수 있습니다.