오픈AI 신모델 GPT-5.4 공개…"이젠 제미나이에 안되네"

10 hours ago 2

오픈AI가 최신 인공지능(AI) 모델 GPT-5.4를 5일(현지시간) 출시했다. 실제 문서 작업에서는 경쟁사 구글 제미나이보다 나은 성과를 보였지만 범용 지능에서는 벽을 넘는 데 실패했다.
이날 출시된 GPT-5.4와 GPT-5.4프로는 추론(GPT-5.2 사고)·코딩(GPT-5.3 코덱스) 등 여러 개로 나뉜 모델을 하나로 통합한 것이 특징이다. 또 회사 범용 AI 모델 최초로 AI가 직접 브라우저를 검색·클릭하고 텍스트를 입력하는 '컴퓨터 활용' 기능을 적용했다. 이 기능은 그간 AI에이전트 모델 오퍼레이터에만 적용됐다.
오픈AI는 GPT-5.4가 "전문가 작업에 최적화된 가장 강력하고 효율적인 최첨단 모델"이라고 강조했다. 스프레드시트, 프레젠테이션, 엑셀 등 소프트웨어 작업을 할 때 강력한 효율을 낼 수 있다는 얘기다. 실제 법률 서류·엔지니어링 설계·고객 지원 등 44개 직종의 업무를 AI가 수행할 수 있는지 확인하는 GDPval 테스트에서 GPT-5.4는 83%의 문항에서 전문가와 동일하거나 같은 성과를 거뒀다.
정보 검색 능력을 측정하는 '브라우즈컴프' 지표에서는 89.3%로 구글 제미나이 3.1프로(85.9%) 앤스로픽 클로드 오퍼스 4.6(84%)보다 높은 점수를 받았다. 코딩 능력을 매기는 'SWE-벤치 프로 퍼블릭' 지표에서도 57.7%로 제미나이3.1 프로(54.2%)를 상회했다.
답변 정확성도 개선됐다. GPT-5.2 대비 개별 주장에서 오류가 발생할 확률은 33%, 전체 응답에 오류가 포함될 확률은 18% 낮았다.
다만 범용적인 AI 성능을 측정하는 지표 '인류 마지막 시험(HLE)' 성적은 39.8%(GPT-5.4프로는 42.7%)로 제미나이 3.1프로(45.9%)를 뛰어넘지 못했다. GPT-5.2 출시 이후 4개월간 준비한 모델임에도 성능 수준이 기대에 못 미쳤다는 평가가 나왔다.
이날 공개된 GPT-5.4 모델은 챗GPT 유료 가입자에게 즉시 제공된다. 기존 모델인 GPT-5.2 사고 모델은 3개월간 유지된 이후 오는 6월 5일 서비스를 종료할 예정이다.

실리콘밸리=김인엽 특파원 inside@hankyung.com

Read Entire Article

오픈AI 신모델 GPT-5.4 공개…"이젠 제미나이에 안되네"

Related

베슬AI, 엔비디아 'GTC 2026' 참가…GPU 클라우드 공개

"한국에서도 이제 쓸 수 있어요?"…외국인들 반색한 이유는 [구글맵이 온다]

업무용 AI 내세운 GPT-5.4…범용 지능선 제미나이 못 넘어

인프라·모델·서비스까지…SKT, 풀스택 AI 공개

'163조원' 시장 잡는다…천하의 엔비디아도 '눈독'

딥시크 새 AI모델 V4 이용료…챗GPT의 50분의 1 이하로

웹툰엔터 프레지던트에…김용수 최고전략책임자

신약 테스트베드된 韓…글로벌 빅파마 임상시험 14% '쑥'

Tips

게임 정보

취업 정보

온라인 툴

유용한 정보

유튜브

Trending

Popular

피겨왕자 차준환, 포디움 바로 앞 4위로 밀라노 올림픽 마쳐

WebMCP (Web Model Context Protocol) 공개

MIK 레이싱, 2026시즌 eN1 라인업 확정

미 상호관세 위법 판결에 정부 긴급회의…"우호적 협의 계속, 대미투자특별법 차질없이 추진"

‘전쟁 희생’ 동료 추모 헬멧 쓰려다 실격…올림픽 ‘정치적 표현’ 금지 어디까지

Step 3.5 Flash – 오픈소스 기반 모델, 빠른 추론과 안정적 실행 지원

Obsidian CLI 공개

YMCA Canada Transforms Non-Profit Finance in the Cloud With ...

Governance, Risk, and Compliance in SAP Cloud ERP 2602 | Rel...

"이미 엄마 인생의 금메달"…최민정이 품고 뛴 엄마의 편지 [2026 밀라노 올림픽]