AI 에이전트 시장의 절반은 한 분야가 차지, 나머지는 아직 미개척 영역임

9 hours ago 3

  • 소프트웨어 엔지니어링이 전체 AI 에이전트 도구 호출의 약 50%를 차지하는 반면, 헬스케어·법률·금융 등 16개 버티컬은 각각 5% 미만에 불과
  • AI 모델의 실제 역량은 인간이 5시간 걸릴 작업을 수행할 수 있는 수준이지만, 실제 사용에서 99.9번째 백분위 세션은 약 42분에 그쳐 역량과 신뢰 사이에 큰 격차 존재
  • 사용자 경험이 쌓일수록 자동 승인률은 20%에서 40% 이상으로 상승하며, 동시에 숙련 사용자는 사전 승인 대신 능동적 모니터링 방식으로 감독 전략을 전환
  • 버티컬 AI의 핵심은 독점 데이터 연동, 도메인 특화 컨텍스트 엔지니어링, 고객 변화 관리이며, 이것이 단순 래퍼와 방어 가능한 기업을 구분하는 기준
  • SaaS가 지난 수십 년간 170개 이상의 유니콘을 배출했듯, 각 SaaS 유니콘에 대응하는 버티컬 AI 유니콘이 등장할 가능성이 있으며 AI 버전은 소프트웨어뿐 아니라 운영자까지 대체 가능

소프트웨어 엔지니어링이 AI 에이전트 활동의 절반 점유

  • Anthropic이 발표한 AI 에이전트 실제 사용 연구에 따르면, 소프트웨어 엔지니어링이 전체 에이전틱 도구 호출의 49.7% 차지
  • 헬스케어는 1%, 법률은 0.9%, 교육은 1.8%에 불과하며, 16개 버티컬 중 9%를 넘는 분야 없음
  • 이는 시장이 포화된 것이 아니라 아직 형성되지 않은 상태
  • Han Wang은 이를 “대부분의 창업가가 간과하는 그린필드 기회”라고 표현함
  • 이 글의 작성자 Garry Tan은 “지금 창업한다면 이 차트의 붉은 영역을 주시해야 한다”고 언급

배포 격차(Deployment Overhang)

  • METR 평가에 따르면 Claude 모델은 인간이 5시간 걸릴 작업을 수행할 수 있으나, 실제 세션은 평균 42분에 불과
  • AI가 할 수 있는 것과 사용자가 허용하는 것 사이의 격차가 대규모 기회를 형성
  • 2025년 10월부터 2026년 1월 사이 99.9번째 백분위 턴 지속 시간이 25분 미만에서 45분 이상으로 거의 두 배 증가
    • 이는 모델 성능 향상뿐 아니라 사용자가 세션마다 신뢰를 축적한 결과
  • 내부 데이터에서 Claude Code의 성공률이 두 배로 증가, 세션당 인간 개입은 5.4회에서 3.3회로 감소
  • 모델의 능력은 충분하지만 배포가 따라가지 못하는 상황, 이는 새로운 제품 기회임

신뢰의 진화 방식

  • 신규 사용자는 Claude Code 세션의 20%만 자동 승인하지만, 750회 세션 경험 후 40% 이상완전 자동 승인으로 전환
  • 반직관적으로, 숙련 사용자는 개입을 덜 하는 것이 아니라 더 많이 개입 — 신규 사용자 개입률 5%, 숙련자 개입률 9%
    • 이는 모순이 아니라 감독(oversight) 전략의 변화: 초보자는 각 단계를 사전 승인, 숙련자는 위임 후 문제 발생 시 개입(사전 승인 → 능동적 모니터링)
  • 안전성 관련 발견: 복잡한 작업에서 Claude Code는 인간이 개입하는 빈도보다 두 배 이상 자주 확인 질문을 제기
    • 에이전트가 무작정 진행하지 않고 불확실할 때 스스로 멈추는 행동 패턴
  • Anthropic 핵심 교훈: 에이전트가 실제로 행사하는 자율성은 모델·사용자·제품이 공동으로 구성하는 것

Aaron Levie의 버티컬 AI 플레이북

  • Aaron Levie가 제시하는 버티컬 AI 구축 공식:
    • 각 산업의 고유한 데이터·워크플로·규제 장벽을 이해하는 것이 방어력 높은 기업의 핵심
    • 단순한 래퍼(wrapper)가 아닌, 고유 데이터 통합·워크플로 자동화·변화 관리 역량이 필요
    • 독점 데이터에 연결되는 에이전틱 소프트웨어 구축
    • 실제 사람과 문제에 맞게 소프트웨어가 작동하도록 설계
    • 도메인 특화 컨텍스트 엔지니어링으로 출력 지능 극대화
    • 대부분의 창업자가 놓치는 부분: 고객을 위한 변화 관리(change management) 추진
  • 버티컬 AI가 방어 가능한 이유: 누구나 래퍼를 만들 수 있지만, 헬스케어 청구·법률 디스커버리·건설 허가 등의 구체적 워크플로, 규제 제약, 조직 마찰을 탐색할 수 있는 곳은 소수
  • SaaS는 수십 년간 10년마다 10배 성장했으며, 지난 20년간 VC 투자금의 40% 이상이 SaaS에 집중, 170개 이상의 SaaS 유니콘 배출
  • 핵심 테제: 각 SaaS 유니콘에 대응하는 버티컬 AI 유니콘이 존재하며, AI 버전은 소프트웨어뿐 아니라 운영자까지 대체하기 때문에 10배 더 클 수 있음

공동 구성(Co-Construction) 인사이트와 정책 시사점

  • Anthropic의 핵심 발견:
    • 자율성은 모델의 고유 속성이 아니라 모델·사용자·제품이 공동으로 구성하는 것이며
    • 사전 배포 평가만으로는 이를 포착할 수 없어 실제 환경에서의 측정이 필수
  • 안전성 수치: 73%의 도구 호출에 인간이 개입, 0.8%만이 되돌릴 수 없는 행동으로 분류
    • 가장 위험한 배포(API 키 유출, 자율 암호화폐 거래 등)는 대부분 보안 평가이지 실제 프로덕션이 아님
  • "모든 행동을 승인하라"는 정책은 안전성 향상 없이 생산성만 저해하며,
    인간이 모니터링하고 개입할 수 있도록 보장하는 것이 더 나은 정책 목표임

유니콘이 숨어 있는 곳

  • 소프트웨어 엔지니어링은 이미 선점된 상태이며, 헬스케어·법률·금융·교육·고객 서비스·물류 등
    한 자릿수 시장 점유율의 16개 버티컬이 도메인 전문성을 에이전트에 내장할 누군가를 기다리는 중
  • 이전에 300개의 SaaS 유니콘이 탄생했고, 다음으로 300개의 버티컬 AI 유니콘이 등장할 것
  • 버티컬을 선택하고, 도메인 전문성을 에이전트에 내장하며, 변화 관리를 해결하는 창업자가 향후 10년의 엔터프라이즈 소프트웨어를 소유할 것
  • 모델은 이미 5시간 동안 작업 가능하지만 사용자는 42분만 허용
    • 이는 AI 활용의 초기 단계임을 보여주며,
    • 단 1분의 지능도 적용되지 않은 분야가 다수 존재함을 시사

Read Entire Article