AI 에이전트 시장의 절반은 한 분야가 차지, 나머지는 아직 미개척 영역임

9 hours ago 3

소프트웨어 엔지니어링이 전체 AI 에이전트 도구 호출의 약 50%를 차지하는 반면, 헬스케어·법률·금융 등 16개 버티컬은 각각 5% 미만에 불과
AI 모델의 실제 역량은 인간이 5시간 걸릴 작업을 수행할 수 있는 수준이지만, 실제 사용에서 99.9번째 백분위 세션은 약 42분에 그쳐 역량과 신뢰 사이에 큰 격차 존재
사용자 경험이 쌓일수록 자동 승인률은 20%에서 40% 이상으로 상승하며, 동시에 숙련 사용자는 사전 승인 대신 능동적 모니터링 방식으로 감독 전략을 전환
버티컬 AI의 핵심은 독점 데이터 연동, 도메인 특화 컨텍스트 엔지니어링, 고객 변화 관리이며, 이것이 단순 래퍼와 방어 가능한 기업을 구분하는 기준
SaaS가 지난 수십 년간 170개 이상의 유니콘을 배출했듯, 각 SaaS 유니콘에 대응하는 버티컬 AI 유니콘이 등장할 가능성이 있으며 AI 버전은 소프트웨어뿐 아니라 운영자까지 대체 가능

소프트웨어 엔지니어링이 AI 에이전트 활동의 절반 점유

METR 평가에 따르면 Claude 모델은 인간이 5시간 걸릴 작업을 수행할 수 있으나, 실제 세션은 평균 42분에 불과
AI가 할 수 있는 것과 사용자가 허용하는 것 사이의 격차가 대규모 기회를 형성
2025년 10월부터 2026년 1월 사이 99.9번째 백분위 턴 지속 시간이 25분 미만에서 45분 이상으로 거의 두 배 증가
- 이는 모델 성능 향상뿐 아니라 사용자가 세션마다 신뢰를 축적한 결과
내부 데이터에서 Claude Code의 성공률이 두 배로 증가, 세션당 인간 개입은 5.4회에서 3.3회로 감소
모델의 능력은 충분하지만 배포가 따라가지 못하는 상황, 이는 새로운 제품 기회임

신규 사용자는 Claude Code 세션의 20%만 자동 승인하지만, 750회 세션 경험 후 40% 이상이 완전 자동 승인으로 전환
반직관적으로, 숙련 사용자는 개입을 덜 하는 것이 아니라 더 많이 개입 — 신규 사용자 개입률 5%, 숙련자 개입률 9%
- 이는 모순이 아니라 감독(oversight) 전략의 변화: 초보자는 각 단계를 사전 승인, 숙련자는 위임 후 문제 발생 시 개입(사전 승인 → 능동적 모니터링)
안전성 관련 발견: 복잡한 작업에서 Claude Code는 인간이 개입하는 빈도보다 두 배 이상 자주 확인 질문을 제기
- 에이전트가 무작정 진행하지 않고 불확실할 때 스스로 멈추는 행동 패턴
Anthropic 핵심 교훈: 에이전트가 실제로 행사하는 자율성은 모델·사용자·제품이 공동으로 구성하는 것

Aaron Levie가 제시하는 버티컬 AI 구축 공식:
- 각 산업의 고유한 데이터·워크플로·규제 장벽을 이해하는 것이 방어력 높은 기업의 핵심
- 단순한 래퍼(wrapper)가 아닌, 고유 데이터 통합·워크플로 자동화·변화 관리 역량이 필요
- 독점 데이터에 연결되는 에이전틱 소프트웨어 구축
- 실제 사람과 문제에 맞게 소프트웨어가 작동하도록 설계
- 도메인 특화 컨텍스트 엔지니어링으로 출력 지능 극대화
- 대부분의 창업자가 놓치는 부분: 고객을 위한 변화 관리(change management) 추진
버티컬 AI가 방어 가능한 이유: 누구나 래퍼를 만들 수 있지만, 헬스케어 청구·법률 디스커버리·건설 허가 등의 구체적 워크플로, 규제 제약, 조직 마찰을 탐색할 수 있는 곳은 소수
SaaS는 수십 년간 10년마다 10배 성장했으며, 지난 20년간 VC 투자금의 40% 이상이 SaaS에 집중, 170개 이상의 SaaS 유니콘 배출
핵심 테제: 각 SaaS 유니콘에 대응하는 버티컬 AI 유니콘이 존재하며, AI 버전은 소프트웨어뿐 아니라 운영자까지 대체하기 때문에 10배 더 클 수 있음

Anthropic의 핵심 발견:
- 자율성은 모델의 고유 속성이 아니라 모델·사용자·제품이 공동으로 구성하는 것이며
- 사전 배포 평가만으로는 이를 포착할 수 없어 실제 환경에서의 측정이 필수
안전성 수치: 73%의 도구 호출에 인간이 개입, 0.8%만이 되돌릴 수 없는 행동으로 분류
- 가장 위험한 배포(API 키 유출, 자율 암호화폐 거래 등)는 대부분 보안 평가이지 실제 프로덕션이 아님
"모든 행동을 승인하라"는 정책은 안전성 향상 없이 생산성만 저해하며,
인간이 모니터링하고 개입할 수 있도록 보장하는 것이 더 나은 정책 목표임

소프트웨어 엔지니어링은 이미 선점된 상태이며, 헬스케어·법률·금융·교육·고객 서비스·물류 등
한 자릿수 시장 점유율의 16개 버티컬이 도메인 전문성을 에이전트에 내장할 누군가를 기다리는 중
이전에 300개의 SaaS 유니콘이 탄생했고, 다음으로 300개의 버티컬 AI 유니콘이 등장할 것
버티컬을 선택하고, 도메인 전문성을 에이전트에 내장하며, 변화 관리를 해결하는 창업자가 향후 10년의 엔터프라이즈 소프트웨어를 소유할 것
모델은 이미 5시간 동안 작업 가능하지만 사용자는 42분만 허용
- 이는 AI 활용의 초기 단계임을 보여주며,
- 단 1분의 지능도 적용되지 않은 분야가 다수 존재함을 시사