오픈AI 최신 사고 모델 o3 공개.. 벤치마크에서 경쟁자 압도

3 weeks ago 14

뉴스 요약쏙

AI 요약은 본문의 핵심만 제공하므로, 전체 맥락을 이해하기 위해서는 기사 본문 전체를 확인하는 것이 좋습니다.

오픈AI가 새 인공지능 모델 o3를 공개하였으며, 이는 이전 모델 o1보다 성능이 크게 향상된 것으로 평가받고 있다.

o3는 여러 벤치마크에서 뛰어난 성적을 기록하며, 특히 ARC-AGI 테스트에서 낮은 컴퓨팅 설정에서도 o1보다 3배 높은 성능을 보여준다.

추가로 소형 모델 o3미니도 출시되어 속도와 비용 면에서 개선된 성능을 갖추고 있다.

회원용

핵심 요약쏙은 회원용 콘텐츠입니다.

매일경제 최신 뉴스를 요약해서 빠르게 읽을 수 있습니다.

오픈AI가 20일(현지시간) 최신 AI모델인 o3을 공개했다. <사진=오픈AI 채널>

오픈AI가 20일(현지시간) 최신 AI모델인 o3을 공개했다. <사진=오픈AI 채널>

오픈AI가 사고력이 뛰어난 인공지능(AI) 모델인 o1의 후속 모델인 o3(오쓰리)를 공개했다.

20일(현지시간) 오픈AI는 12일 간의 신규 서비스 공개 이벤트의 마지막날 9월 공개한 o1의 후속모델인 o3를 공개했다.

오픈AI에 따르면 o3는 다양한 벤치마크에서 뛰어난 성능을 기록했으며, 일반인공지능(AGI)에 근접한 성능을 냈다.

AI 시스템이 학습된 데이터 외부에서 새로운 기술을 효율적으로 습득할 수 있는지 평가하기 위해 고안된 테스트인 ARC-AGI에서 o3는 높은 컴퓨팅 설정에서 87.5%의 점수를 획득다. 최악의 상황(낮은 컴퓨팅 설정)에서는 o1의 3배에 달하는 성능을 보였다. 이는 최근 5년간 가장 뛰어난 성과다.

다만 높은 컴퓨팅 설정은 작업당 수천 달러에 달하는 엄청난 비용이 들었다고 ARC-AGI 공동창업자 프랑수아 콜레는 설명했다.

o3는 프로그래밍에 중점을 둔 벤치마크인 SWE-벤치 베리파이드(Bench Verified)에서 o1보다 22.8% 포인트 더 높은 성능을 보이며 코딩 능력의 또 다른 척도인 코드포스 등급에서 2727점을 기록했습니다.

o3는 2024년 미국 수학능력시험에서 단 한 문제만 틀린 채 96.7%를 획득하고 대학원 수준의 생물학, 물리학, 화학 문제들로 구성된 GPQA 다이아몬드에서 87.7%를 달성했습니다. o3는 EpochAI의 프론티어 수학 벤치마크에서 25.2%의 문제를 해결했다.

오픈AI는 소형모델인 o3미니도 공개했다. 비용을 낮추고 속도를 높인 모델이다. o1미니보다 4배 정도 빠르다.

o1의 후속모델이 o3가 된 것은 o2라는 이름의 영국 통신회사가 있기 때문으로 추정된다.

이번에 공개된 o3는 일반 공개 전으로 일부 사용자를 대상으로 프리뷰가 제공될 예정이다. 또한, AI 얼라인먼트와 안전 문제를 보강할 예정이다.

[실리콘밸리=이덕주 특파원]

이 기사가 마음에 들었다면, 좋아요를 눌러주세요.

좋아요 0

Read Entire Article