2026년 AI 현황을 설명하는 그래프들
1 day ago
4
- AI Index 2026은 벤치마크 성능, 투자, 대중 인식, 컴퓨트, 탄소 배출 같은 지표로 AI 전반의 흐름을 집계한 보고서
- 주목할 만한 AI 모델 출시는 미국과 산업계 중심으로 이어졌고, 중국은 산업용 로봇 설치에서 뚜렷한 우위 기록
- 전 세계 AI 컴퓨트 용량은 2022년 이후 매년 3배 이상 증가했고, Nvidia GPU가 현재 총 용량의 60퍼센트 이상 차지
- 멀티모달 LLM과 agentic AI의 벤치마크 성능은 빠르게 상승했지만, 아날로그 시계 읽기 같은 일반 과제에서는 낮은 정확도 지속
- 2025년 AI 투자는 5,810억 달러를 넘겨 최고치를 기록했고, 고용 영향과 규제 신뢰, 대중 수용도는 국가와 지표에 따라 큰 차이 드러남
- Stanford의 400페이지 이상 분량 AI Index 2026 보고서가 벤치마크 점수, 투자, 대중 인식 등 여러 각도에서 AI 현황을 집계
- 선도 AI 모델 성능은 계속 가속 중이며, OpenAI와 Anthropic 같은 대형 AI 기업들은 올해 후반 IPO를 향해 나아가는 중
- AI에 대한 반감도 이어지며, 특히 미국에서는 지방정부가 신규 데이터센터 개발에 대한 제한 또는 전면 금지를 받아들이기 시작함
- 2021년부터 2025년까지의 이전 연도 보도에 이어, 2026년 AI 현황을 압축하는 추세 선별
미국의 AI 모델 우위
- 미국은 지난 10년 동안 주목할 만한 AI 모델 출시를 주도했고, 2025년에도 그 흐름 유지
- Epoch AI 기준으로 미국 기반 조직이 2025년에 출시한 주목할 만한 모델 수는 50개
- 중국의 산출량은 격차를 좁히기 시작
- 주목할 만한 모델의 거의 전부는 산업계에서 등장
- 2025년 산업계의 주목할 만한 모델 출시는 87건
- 학계와 정부 기관을 모두 합친 다른 출처의 출시는 7건
- 산업계 비중은 장기적으로 크게 확대
- 산업계가 출시한 모델은 현재 주목할 만한 모델의 90퍼센트 이상
- 2015년에는 50퍼센트 미만, 2003년에는 0
중국의 로보틱스 배치 우위
- 미국 기업이 주목할 만한 AI 모델 수에서는 앞서지만, 로보틱스 배치에서는 중국이 뚜렷한 우위
- International Federation of Robotics 데이터 기준, 중국의 2024년 산업용 로봇 설치 수는 295,000대
- 일본은 약 44,500대, 미국은 34,200대 설치
전 세계 AI 컴퓨트 급증
- Epoch AI의 총 AI 컴퓨트 용량 지표가 AI 인프라 확장의 대표 수치로 제시됨
- Nvidia의 H100e 성능을 기준척도로 삼은 그래프에서, 전 세계 AI 컴퓨트 용량은 2022년 이후 매년 3배 이상 증가
- 2021년을 첫 추적 연도로 둘 때 총 AI 컴퓨트는 30배 증가
- 이 확장에서 Nvidia가 가장 큰 수혜 기록
- Nvidia GPU가 현재 전 세계 총 AI 컴퓨트 용량의 60퍼센트 이상 차지
- 자체 AI 하드웨어를 설계하는 Amazon과 Google이 그 뒤를 이음
AI 학습과 추론의 탄소 배출
- AI 학습 과정의 탄소 배출량은 이전 해에도 지적된 항목이었고, 2026년에도 우려가 이어짐
- 최신 프런티어 대규모 언어 모델 학습은 매우 큰 배출량으로 추정됨
- xAI의 Grok 4 학습 배출량 추정치는 탄소환산 기준 72,000톤 초과
- OpenAI GPT-4는 5,184톤, Meta Llama 3.1 405B는 8,930톤 추정
- Ray Perrault는 이 수치들이 추정치임을 밝히며 해석에 주의 요청
- “These estimates should be interpreted with caution”
- Grok의 경우 Forbes 기사, xAI 발언, 기타 검증 불가 출처에서 추론한 입력값에 크게 의존해 불확실성 존재
- Epoch AI는 Grok 4의 배출량을 독립적으로 약 140,000톤 CO₂로 더 높게 추정
- AI 추론 배출량도 증가 중이며, 모델 간 차이도 큼
- 가장 비효율적인 추론 모델의 배출량은 가장 효율적인 모델보다 10배 이상
- DeepSeek V3는 중간 길이 프롬프트 응답 시 약 23와트 소비 추정
- Claude 4 Opus는 약 5와트 소비 추정
LLM 벤치마크 성능 가속
- 지난 10년 동안 AI 모델 성능은 매우 빠르게 향상됐고, 그래프상으로 그 진전 속도는 더 빨라지는 모습
- 특히 멀티모달 LLM은 새로 만들어지는 벤치마크를 거의 즉시 정복하는 수준으로 진전
- Agentic AI 영역의 상승폭이 가장 가파름
- 차트 오른쪽의 두 급경사 선은 자율 컴퓨터 사용을 평가하는 OSWorld benchmark
- 자율 코딩을 평가하는 SWE-Bench Verified 소프트웨어 엔지니어링 벤치마크
- Humanity’s Last Exam에서도 성능이 빠르게 향상
- 2025년 Stanford AI Index에서 1위 모델인 OpenAI o1의 정답률은 8.8퍼센트
- 이후 정확도는 38.3퍼센트까지 상승
- 2026년 4월 기준 최고 점수 모델인 Anthropic Claude Opus 4.6과 Google Gemini 3.1 Pro 등은 50퍼센트 초과
- Ray Perrault는 벤치마크와 현실 성능의 대응 관계에 주의 제기
- “We generally lack measures of how well a system (or agent) needs to function in a particular setting”
- 법률 추론 벤치마크 정확도 75퍼센트만으로 실제 로펌 업무 적합성을 알기 어렵다는 언급
의료 분야 AI 연구 확대
- 의료 연구에서 AI 채택이 빠르게 증가
- AI 기반 신약 개발 관련 논문 수는 지난 2년 동안 2배 이상 증가
- 의료 이미지와 텍스트를 함께 다루는 멀티모달 바이오메디컬 AI 논문 수는 2년 전 대비 2.7배
아날로그 시계 읽기 한계
- 일부 영역의 급속한 향상과 달리, 아날로그 시계 읽기와 달력 이해 같은 일반 과제에서는 약점 지속
- 멀티모달 LLM의 아날로그 시계 판독 능력을 측정하는 ClockBench에서 최고 성능 모델도 성공 확률이 절반 수준
- OpenAI GPT-5.4의 정답 확률은 50 대 50
- 대부분 모델은 이보다 훨씬 낮은 성적 기록
- Anthropic Claude Opus 4.6의 정확도는 8.9퍼센트
- 같은 모델이 Humanity’s Last Exam에서는 최고 수준 점수를 기록했다는 점도 함께 언급
- Ray Perrault는 이를 보다 일반적인 문제와 연결
- 언어와 이미지, 음성 톤 같은 다른 모달리티의 조합을 묻는 경우에도 언어 성분이 예상보다 큰 비중 차지
- 비언어 정보를 완전히 무시하는 수준까지 이어질 수 있다는 연구 흐름 언급
2025년 AI 투자 최고치
- AI 모델 성능 향상과 함께 AI 투자도 동반 상승
- AI 분석 기업 Quid 데이터 기준, 2025년 AI 투자는 5,810억 달러 초과로 신기록
- 2024년 2,530억 달러의 두 배 이상
- 이전 최고치였던 2021년 3,600억 달러도 크게 상회
- 2021년과 달리 2025년의 기록은 인수합병이 아니라 AI 기업에 대한 민간 투자가 주도
- 투자금의 대부분은 미국으로 유입
- 지난해 미국 내 AI 투자액은 3,440억 달러 초과
소프트웨어 엔지니어의 AI 집중
- GitHub에서 AI 관련 프로젝트 수가 2025년까지 558만 개로 급증
- 2020년 대비 약 5배
- 2024년 대비 23.7퍼센트 증가
- 이 증가는 단순한 AI 생성 프로젝트 범람만으로 보이지 않음
- 별 10개 이상 프로젝트 수도 비슷한 속도로 증가
- AI 프로젝트 전체가 받은 스타 수도 비슷한 속도로 증가
- 사람의 참여가 존재함을 시사
- 대표 인기 사례로 오픈소스 agentic AI 소프트웨어 OpenClaw 제시
- GitHub에서 352,000 stars 획득
- Ray Perrault는 AI 봇이나 에이전트 프로젝트가 열기에 일부 영향을 줄 수 있다는 점은 인정
- “probably the intensity of GitHub use is highly correlated with the intensity of AI use”
- Stanford 보고서에는 언급되지 않은 활동 추적 웹사이트 Agents in the Wild 기준으로, GitHub 활동의 다수는 여전히 인간이 수행하는 것으로 보인다는 언급
- 컴퓨터과학 논문에서도 AI 열기 강세
- AI 관련 컴퓨터과학 논문 수는 지난 10년간 102,000건에서 258,000건으로 2배 이상 증가
- 2024년 기준 이 가운데 68퍼센트 이상은 학계 출처
- 정부와 산업계 비중은 각각 약 11.5퍼센트, 12.5퍼센트
- 성장은 machine learning, computer vision, generative AI 분야가 주도
고용에 대한 AI 영향 불확실성
- 생성형 AI 확산과 함께 고용 불안이 커졌지만, 현재 데이터는 혼재된 결과 제시
- AI 대체 위험이 높은 직군으로 여겨지는 software developers와 customer support agents의 연령대별 정규화 인원 수 그래프 제시
- 초급 일자리는 감소
- 중견 및 시니어 직무는 유지되거나 증가
- 이런 변화는 더 넓은 경제 흐름과 분리해 해석하기 어려움
- 보고서는 많은 직종 전반에서 실업률 상승 언급
- 예상과 달리 AI 노출이 가장 낮은 노동자의 실업률 상승폭이, AI 노출이 가장 높은 노동자보다 더 큼
AI에 대한 대중 인식 변화
- Ipsos 설문에서 AI에 대한 낙관론이 최근 몇 년간 소폭이지만 눈에 띄게 증가
- “benefits outweigh the drawbacks” 응답은 2024년 55퍼센트에서 59퍼센트로 상승
- AI를 “good understanding” 한다는 응답은 67퍼센트에서 68퍼센트로 소폭 상승
- 유사 질문들에서도 전체 수용도는 부정보다 긍정 쪽이 우세하지만, 일부 부정 감정도 증가
- 응답자의 52퍼센트가 AI를 사용하는 제품과 서비스가 자신을 “nervous”하게 만든다고 응답
- 국가별 편차가 큼
- 중국, Malaysia, Thailand, Indonesia, Singapore를 포함한 동남아시아 국가들은 더 긍정적인 방향
- 연간 기준 가장 큰 긍정 전환은 Germany 12퍼센트, France 10퍼센트, the Netherlands 10퍼센트
- Colombia는 -6퍼센트로 가장 큰 부정 전환 기록
AI 규제 신뢰의 국가별 차이
- AI가 긍정적 영향을 줄 것이라는 인식 증가와 함께, 정부 규제 신뢰에 대한 깊은 불신도 일부 국가에서 동반
- 특히 미국은 AI 투자 선도국임에도 규제 신뢰도는 최하위권
- Ipsos 설문에서 정부의 AI 규제를 신뢰한다는 미국 응답자는 31퍼센트
- 많은 유럽 국가와 일본도 낮은 신뢰 수준
- 아시아와 남아메리카 국가들은 정부의 AI 규제 능력에 대한 신뢰가 가장 큼
- 미국과 Colombia의 대비가 두드러짐
- 미국은 AI 규제에 대한 깊은 불신이 있지만, 다수 응답자가 AI 편익이 단점보다 클 것으로 봄
- Colombia는 AI 규제에 대한 신뢰는 높지만, AI 전반에 대한 감정은 악화
- 2025년 AI 서사의 축소판처럼, 모델 성능의 질과 사회적 영향에 대한 인식은 과제와 질문에 따라 큰 폭으로 달라짐
-
Homepage
-
Tech blog
- 2026년 AI 현황을 설명하는 그래프들