- Anthropic이 Claude 3.7 Sonnet 출시 이후 AI 경제 영향에 대한 두 번째 연구 보고서 발표
- 이 보고서는 새롭고 가장 강력한 모델인 Claude 3.7 Sonnet의 출시 이후 Claude.ai 사용 데이터 분석
- 데이터셋은 자유롭게 다운로드 가능하도록 공개됨
주요 발견
- Claude 3.7 Sonnet 출시 이후 코딩, 교육, 과학, 의료 애플리케이션에서의 사용 비중 증가
- Claude 3.7 Sonnet의 새로운 "확장 사고(extended thinking)" 모드는 주로 기술적 작업에 사용됨
- 컴퓨터 과학 연구원, 소프트웨어 개발자, 멀티미디어 애니메이터, 비디오 게임 디자이너와 관련된 작업에 주로 활용
- 직무 및 직업 수준에서의 보조/자동화 분석 데이터 공개
- 카피라이터 및 편집자와 관련된 작업은 가장 높은 수준의 작업 반복(인간과 모델이 함께 작성)을 보임
- 번역가 및 통역사와 관련된 작업은 가장 높은 수준의 지시적 행동(모델이 최소한의 인간 참여로 작업 완료)을 보임
- Claude.ai에서의 사용에 대한 상향식 분류 체계 최초 공개
- 630개의 세분화된 카테고리를 포함하는 새로운 데이터셋 제공
- 이 분류는 기존의 하향식 접근 방식에서 놓칠 수 있는 사용 사례를 파악하는 데 도움이 될 것으로 기대
Claude 3.7 Sonnet 출시 이후 변화
- 출시 후 11일 동안 100만 개의 익명화된 Claude.ai 무료 및 Pro 대화를 분석
- 코딩, 교육, 과학 분야의 사용 비중이 소폭 증가
- 코딩 사용 증가는 Claude 3.7 Sonnet의 코딩 벤치마크 점수 향상 때문으로 예상
- 다른 카테고리 증가는 AI의 경제 전반에 걸친 확산, 해당 도메인에 대한 코딩의 새로운 적용, 또는 모델의 예상치 못한 능력 향상을 반영할 수 있음
확장 사고 모드(extended thinking) 사용 패턴
- 확장 사고 모드는 주로 기술적 및 창의적 문제 해결 상황에서 사용됨
- 컴퓨터 및 정보 연구 과학자 관련 작업이 거의 10%로 가장 많이 사용
- 소프트웨어 개발자(약 8%), 멀티미디어 아티스트(약 7%), 비디오 게임 디자이너(약 6%) 관련 작업에서도 상당한 사용률 보임
- 이 새로운 모델 기능에 대한 추가 연구를 위해, 각 작업과 관련된 사고 모드 비율을 매핑하는 데이터셋 공개
보조 vs 자동화 비율 변화
- 보조 사용과 자동화 사용 간의 균형은 새로운 데이터에서도 기본적으로 변함없이 보조가 57%를 차지
- 자동화 및 보조 유형에서 일부 변화 관찰
- 사용자가 다양한 주제에 대한 정보나 설명을 요청하는 학습 상호작용이 ~23%에서 ~28%로 증가
- 사회 서비스 작업은 75%에 가까운 보조 사용률을 보임
- 생산 또는 컴퓨터 및 수학 직업과 관련된 작업은 보조/자동화 비율이 50-50%에 가깝게 나타남
- 자동화가 지배적인 직업 카테고리는 없음
상향식 분류 체계
- Claude.ai 사용에 대한 상향식 데이터셋 공개
- Clio를 사용하여 생성되고 동일한 익명화된 대화 데이터셋 사용
- 630개의 세분화된 클러스터로 구성되며, 관련 설명, 보급 지표, 자동화/보조 분석 포함
- 계층 구조의 3단계로 구성됨
- 특히 흥미로운 클러스터 예시:
- 수자원 관리 시스템 및 인프라 프로젝트 지원
- 대화형 시각화 기능이 있는 물리 기반 시뮬레이션 생성
- 폰트 선택, 구현 및 문제 해결 지원
- 구직 지원 자료 생성 및 개선 지원
- 배터리 기술 및 충전 시스템에 대한 지침 제공
결론 및 향후 계획
- 모델이 발전함에 따라 경제적 영향에 대한 측정도 발전해야 함
- Claude 3.7 Sonnet 출시 이후 데이터에서 코딩, 교육, 과학적 사용 사례의 비교적 소폭 증가와 보조/자동화 균형에는 변화가 없음
- 확장 사고 모드는 기술 도메인과 작업에서 가장 높은 빈도로 사용됨
- 작업 및 직업 전반에 걸친 자동화/보조 패턴에서 패턴 확인
- 향후 몇 개월 동안 이러한 지표를 계속 추적하고 능력이 향상되고 모델이 경제 전반에 계속 적용됨에 따라 새로운 지표 개발 예정