2026년 AI 현황을 설명하는 그래프들

3 weeks ago 23

AI Index 2026은 벤치마크 성능, 투자, 대중 인식, 컴퓨트, 탄소 배출 같은 지표로 AI 전반의 흐름을 집계한 보고서
주목할 만한 AI 모델 출시는 미국과 산업계 중심으로 이어졌고, 중국은 산업용 로봇 설치에서 뚜렷한 우위 기록
전 세계 AI 컴퓨트 용량은 2022년 이후 매년 3배 이상 증가했고, Nvidia GPU가 현재 총 용량의 60퍼센트 이상 차지
멀티모달 LLM과 agentic AI의 벤치마크 성능은 빠르게 상승했지만, 아날로그 시계 읽기 같은 일반 과제에서는 낮은 정확도 지속
2025년 AI 투자는 5,810억 달러를 넘겨 최고치를 기록했고, 고용 영향과 규제 신뢰, 대중 수용도는 국가와 지표에 따라 큰 차이 드러남

2026 AI Index 보고서의 핵심 지표

Stanford의 400페이지 이상 분량 AI Index 2026 보고서가 벤치마크 점수, 투자, 대중 인식 등 여러 각도에서 AI 현황을 집계
선도 AI 모델 성능은 계속 가속 중이며, OpenAI와 Anthropic 같은 대형 AI 기업들은 올해 후반 IPO를 향해 나아가는 중
AI에 대한 반감도 이어지며, 특히 미국에서는 지방정부가 신규 데이터센터 개발에 대한 제한 또는 전면 금지를 받아들이기 시작함
2021년부터 2025년까지의 이전 연도 보도에 이어, 2026년 AI 현황을 압축하는 추세 선별

미국의 AI 모델 우위

미국은 지난 10년 동안 주목할 만한 AI 모델 출시를 주도했고, 2025년에도 그 흐름 유지
- Epoch AI 기준으로 미국 기반 조직이 2025년에 출시한 주목할 만한 모델 수는 50개
- 중국의 산출량은 격차를 좁히기 시작
주목할 만한 모델의 거의 전부는 산업계에서 등장
- 2025년 산업계의 주목할 만한 모델 출시는 87건
- 학계와 정부 기관을 모두 합친 다른 출처의 출시는 7건
산업계 비중은 장기적으로 크게 확대
- 산업계가 출시한 모델은 현재 주목할 만한 모델의 90퍼센트 이상
- 2015년에는 50퍼센트 미만, 2003년에는 0

중국의 로보틱스 배치 우위

미국 기업이 주목할 만한 AI 모델 수에서는 앞서지만, 로보틱스 배치에서는 중국이 뚜렷한 우위
- International Federation of Robotics 데이터 기준, 중국의 2024년 산업용 로봇 설치 수는 295,000대
- 일본은 약 44,500대, 미국은 34,200대 설치

전 세계 AI 컴퓨트 급증

Epoch AI의 총 AI 컴퓨트 용량 지표가 AI 인프라 확장의 대표 수치로 제시됨
Nvidia의 H100e 성능을 기준척도로 삼은 그래프에서, 전 세계 AI 컴퓨트 용량은 2022년 이후 매년 3배 이상 증가
- 2021년을 첫 추적 연도로 둘 때 총 AI 컴퓨트는 30배 증가
이 확장에서 Nvidia가 가장 큰 수혜 기록
- Nvidia GPU가 현재 전 세계 총 AI 컴퓨트 용량의 60퍼센트 이상 차지
- 자체 AI 하드웨어를 설계하는 Amazon과 Google이 그 뒤를 이음

AI 학습과 추론의 탄소 배출

AI 학습 과정의 탄소 배출량은 이전 해에도 지적된 항목이었고, 2026년에도 우려가 이어짐
최신 프런티어 대규모 언어 모델 학습은 매우 큰 배출량으로 추정됨
- xAI의 Grok 4 학습 배출량 추정치는 탄소환산 기준 72,000톤 초과
- OpenAI GPT-4는 5,184톤, Meta Llama 3.1 405B는 8,930톤 추정
Ray Perrault는 이 수치들이 추정치임을 밝히며 해석에 주의 요청
- “These estimates should be interpreted with caution”
- Grok의 경우 Forbes 기사, xAI 발언, 기타 검증 불가 출처에서 추론한 입력값에 크게 의존해 불확실성 존재
- Epoch AI는 Grok 4의 배출량을 독립적으로 약 140,000톤 CO₂로 더 높게 추정
AI 추론 배출량도 증가 중이며, 모델 간 차이도 큼
- 가장 비효율적인 추론 모델의 배출량은 가장 효율적인 모델보다 10배 이상
- DeepSeek V3는 중간 길이 프롬프트 응답 시 약 23와트 소비 추정
- Claude 4 Opus는 약 5와트 소비 추정

LLM 벤치마크 성능 가속

지난 10년 동안 AI 모델 성능은 매우 빠르게 향상됐고, 그래프상으로 그 진전 속도는 더 빨라지는 모습
특히 멀티모달 LLM은 새로 만들어지는 벤치마크를 거의 즉시 정복하는 수준으로 진전
Agentic AI 영역의 상승폭이 가장 가파름
- 차트 오른쪽의 두 급경사 선은 자율 컴퓨터 사용을 평가하는 OSWorld benchmark
- 자율 코딩을 평가하는 SWE-Bench Verified 소프트웨어 엔지니어링 벤치마크
Humanity’s Last Exam에서도 성능이 빠르게 향상
- 2025년 Stanford AI Index에서 1위 모델인 OpenAI o1의 정답률은 8.8퍼센트
- 이후 정확도는 38.3퍼센트까지 상승
- 2026년 4월 기준 최고 점수 모델인 Anthropic Claude Opus 4.6과 Google Gemini 3.1 Pro 등은 50퍼센트 초과
Ray Perrault는 벤치마크와 현실 성능의 대응 관계에 주의 제기
- “We generally lack measures of how well a system (or agent) needs to function in a particular setting”
- 법률 추론 벤치마크 정확도 75퍼센트만으로 실제 로펌 업무 적합성을 알기 어렵다는 언급

의료 분야 AI 연구 확대

의료 연구에서 AI 채택이 빠르게 증가
AI 기반 신약 개발 관련 논문 수는 지난 2년 동안 2배 이상 증가
의료 이미지와 텍스트를 함께 다루는 멀티모달 바이오메디컬 AI 논문 수는 2년 전 대비 2.7배

아날로그 시계 읽기 한계

일부 영역의 급속한 향상과 달리, 아날로그 시계 읽기와 달력 이해 같은 일반 과제에서는 약점 지속
멀티모달 LLM의 아날로그 시계 판독 능력을 측정하는 ClockBench에서 최고 성능 모델도 성공 확률이 절반 수준
- OpenAI GPT-5.4의 정답 확률은 50 대 50
대부분 모델은 이보다 훨씬 낮은 성적 기록
- Anthropic Claude Opus 4.6의 정확도는 8.9퍼센트
- 같은 모델이 Humanity’s Last Exam에서는 최고 수준 점수를 기록했다는 점도 함께 언급
Ray Perrault는 이를 보다 일반적인 문제와 연결
- 언어와 이미지, 음성 톤 같은 다른 모달리티의 조합을 묻는 경우에도 언어 성분이 예상보다 큰 비중 차지
- 비언어 정보를 완전히 무시하는 수준까지 이어질 수 있다는 연구 흐름 언급

2025년 AI 투자 최고치

AI 모델 성능 향상과 함께 AI 투자도 동반 상승
AI 분석 기업 Quid 데이터 기준, 2025년 AI 투자는 5,810억 달러 초과로 신기록
- 2024년 2,530억 달러의 두 배 이상
- 이전 최고치였던 2021년 3,600억 달러도 크게 상회
2021년과 달리 2025년의 기록은 인수합병이 아니라 AI 기업에 대한 민간 투자가 주도
투자금의 대부분은 미국으로 유입
- 지난해 미국 내 AI 투자액은 3,440억 달러 초과

소프트웨어 엔지니어의 AI 집중

GitHub에서 AI 관련 프로젝트 수가 2025년까지 558만 개로 급증
- 2020년 대비 약 5배
- 2024년 대비 23.7퍼센트 증가
이 증가는 단순한 AI 생성 프로젝트 범람만으로 보이지 않음
- 별 10개 이상 프로젝트 수도 비슷한 속도로 증가
- AI 프로젝트 전체가 받은 스타 수도 비슷한 속도로 증가
- 사람의 참여가 존재함을 시사
대표 인기 사례로 오픈소스 agentic AI 소프트웨어 OpenClaw 제시
- GitHub에서 352,000 stars 획득
Ray Perrault는 AI 봇이나 에이전트 프로젝트가 열기에 일부 영향을 줄 수 있다는 점은 인정
- “probably the intensity of GitHub use is highly correlated with the intensity of AI use”
- Stanford 보고서에는 언급되지 않은 활동 추적 웹사이트 Agents in the Wild 기준으로, GitHub 활동의 다수는 여전히 인간이 수행하는 것으로 보인다는 언급
컴퓨터과학 논문에서도 AI 열기 강세
- AI 관련 컴퓨터과학 논문 수는 지난 10년간 102,000건에서 258,000건으로 2배 이상 증가
- 2024년 기준 이 가운데 68퍼센트 이상은 학계 출처
- 정부와 산업계 비중은 각각 약 11.5퍼센트, 12.5퍼센트
- 성장은 machine learning, computer vision, generative AI 분야가 주도

고용에 대한 AI 영향 불확실성

생성형 AI 확산과 함께 고용 불안이 커졌지만, 현재 데이터는 혼재된 결과 제시
AI 대체 위험이 높은 직군으로 여겨지는 software developers와 customer support agents의 연령대별 정규화 인원 수 그래프 제시
- 초급 일자리는 감소
- 중견 및 시니어 직무는 유지되거나 증가
이런 변화는 더 넓은 경제 흐름과 분리해 해석하기 어려움
- 보고서는 많은 직종 전반에서 실업률 상승 언급
- 예상과 달리 AI 노출이 가장 낮은 노동자의 실업률 상승폭이, AI 노출이 가장 높은 노동자보다 더 큼

AI에 대한 대중 인식 변화

Ipsos 설문에서 AI에 대한 낙관론이 최근 몇 년간 소폭이지만 눈에 띄게 증가
- “benefits outweigh the drawbacks” 응답은 2024년 55퍼센트에서 59퍼센트로 상승
- AI를 “good understanding” 한다는 응답은 67퍼센트에서 68퍼센트로 소폭 상승
유사 질문들에서도 전체 수용도는 부정보다 긍정 쪽이 우세하지만, 일부 부정 감정도 증가
- 응답자의 52퍼센트가 AI를 사용하는 제품과 서비스가 자신을 “nervous”하게 만든다고 응답
국가별 편차가 큼
- 중국, Malaysia, Thailand, Indonesia, Singapore를 포함한 동남아시아 국가들은 더 긍정적인 방향
- 연간 기준 가장 큰 긍정 전환은 Germany 12퍼센트, France 10퍼센트, the Netherlands 10퍼센트
- Colombia는 -6퍼센트로 가장 큰 부정 전환 기록

AI 규제 신뢰의 국가별 차이

AI가 긍정적 영향을 줄 것이라는 인식 증가와 함께, 정부 규제 신뢰에 대한 깊은 불신도 일부 국가에서 동반
특히 미국은 AI 투자 선도국임에도 규제 신뢰도는 최하위권
- Ipsos 설문에서 정부의 AI 규제를 신뢰한다는 미국 응답자는 31퍼센트
많은 유럽 국가와 일본도 낮은 신뢰 수준
아시아와 남아메리카 국가들은 정부의 AI 규제 능력에 대한 신뢰가 가장 큼
미국과 Colombia의 대비가 두드러짐
- 미국은 AI 규제에 대한 깊은 불신이 있지만, 다수 응답자가 AI 편익이 단점보다 클 것으로 봄
- Colombia는 AI 규제에 대한 신뢰는 높지만, AI 전반에 대한 감정은 악화
2025년 AI 서사의 축소판처럼, 모델 성능의 질과 사회적 영향에 대한 인식은 과제와 질문에 따라 큰 폭으로 달라짐