오픈AI ‘o3’ 공개… 내년 출시
수학시험 정답률 96.7% 달해
수학시험 정답률 96.7% 달해
오픈AI가 추론능력에 초점을 맞춘 인공지능 모델 'o3'를 20일(현지시간) 공개했다. 'o3'는 지난 9월 오픈AI가 출시한 추론 모델 'o1'(오원)의 업그레이드 버전으로, 오픈AI는 소형 모델인 'o3 미니'도 함께 선보였다. 샘 올트먼 최고경영자(CEO)는 "내년 1월 말 'o3 미니'를 먼저 출시하고 곧이어 'o3'를 내놓을 예정"이라고 말했다. 일부 연구원에게는 이날부터 미리보기 형태로 제공된다.
o3는 물리학, 과학, 수학과 같은 분야에 더 특화됐다. 'o3'는 프롬프트를 받으면 응답 전 잠시 멈추고 관련 프롬프트를 고려해 자신의 추론을 설명한다. 이후 가장 정확하다고 생각되는 응답을 요약한다. 특히 'o3'에서는 '추론 시간 조정'이 새롭게 도입됐다. 이용자는 연산 시간, 즉 'o3'의 사고 시간을 '낮음, 중간, 높음'으로 설정할 수 있는데 연산 시간이 길수록 성능은 더 좋아진다.
오픈AI는 'o3'가 벤치마크(성능 측정)에서 다른 모델을 압도한다고 설명했다.
프로그래밍 작업에 초점을 맞춘 벤치마크(SWE-Bench Verified)에서는 'o1'보다 22.8%p 높은 성능을 보였으며 코딩 실력 측정 지표(Codeforces)에서는 2727점을 기록, 엔지니어 상위 99.2%에 해당하는 2400점을 크게 뛰어넘었다.
올해 미국 초청 수학시험(AIME)에서는 단 한 문제만 틀려 96.7%의 점수를 기록했고 대학원 수준의 생물학·물리학·화학 문제 테스트(GPQA Diamond)에서는 87.7%의 성과를 거뒀다고 오픈AI는 설명했다.
한편 오픈AI가 한층 개선됨에 따라 구글과 메타의 AI 모델과 경쟁이 한층 가속화할 전망이다.
구글은 이달 초 '제미나이 2.0'을 발표했다. 이전 모델보다 두 배 더 빠르며 "생각하고, 기억하고, 계획하고, 심지어 대신 조치를 취할 수 있다"고 구글은 설명했다. 페이스북 메타플랫폼도 내년 '라마 4'를 출시할 예정이다.
longss@fnnews.com 성초롱 기자
※ 저작권자 ⓒ 파이낸셜뉴스, 무단전재-재배포 금지