
최근 인공지능(AI) 학습과 관련한 저작권 문제를 다루는 1심 판결(Thomson Reuters v. ROSS Intelligence, Bartz v. Anthropic PBC, Kadrey v. Meta Platforms)이 나오면서 그 기준이 정립되어 가고 있는데, 미국 저작권청은 이 문제에 관한 보고서(초안)를 발표한 바 있어, 그 내용을 살펴보고자 한다.
미국 저작권청은 2025년 5월 발표한 'Copyright and Artificial Intelligence-Part 3:Generative AI Training' 보고서를 통해 생성형 AI 모델의 학습 단계에서 발생하는 저작권 문제를 종합적으로 검토했다.
위 보고서는 먼저 대규모 데이터 수집·정제, 모델 학습, 파라미터 고정, 그리고 출력·배포로 이어지는 기술적 흐름을 설명하면서, 이 과정에서 나타나는 '메모리제이션'--즉 모델이 학습 데이터에 포함된 저작물의 표현을 거의 그대로 재현하는 현상--이 저작권 침해 위험을 높인다고 보았다. 이러한 위험은 데이터 크롤링 단계에서 이미 대규모 복제가 이루어지고, 토큰화·캐시 과정에서도 수많은 임시 사본이 생성되며, 학습된 파라미터 공간이 원저작물의 표현을 압축된 형태로 '각인'하기 때문에 구조적으로 발생한다고 지적했다.
법적 분석 부분에서 저작권청은 데이터 수집·정제, 학습용 복제, 파라미터 저장, 출력 결과물의 재배포 등 모든 단계가 미국 저작권법이 규정한 복제권과 2차 저작물 작성권을 원칙적으로 침해할 수 있다고 평가했다. 다만 책임 여부는 공정이용(fair use) 판단에 달려 있다고 보았는데, 비표현적이고 변형성이 높은 이용은 허용될 가능성이 크지만, 불법적 수단으로 구축된 대규모 상업 모델이 창작물 시장과 직접 경쟁하는 경우에는 공정이용의 범위를 넘어선다고 명시했다. 공정이용 4요소 중 특히 '시장 대체효과' 요소에서, AI가 창작물과 경쟁 관계에 있는 결과물을 대량 생산하면 시장 침해가 현실화된다고 판단했다.
위 보고서는 라이선스·보상 체계를 크게 네 가지로 구분하여 검토했는데, 첫째, 개별·집단 자발적 라이선스 모델은 이미 일부 분야에서 실현 가능성이 입증되었으나, 모든 저작물 범주에 일괄 적용하기에는 비용 및 표준화 문제가 크다고 설명합니다. 둘째, 강제 라이선스 제도는 요율 고정과 산업 관행 고착 등 부작용이 예상되어 현시점에서는 권장하지 않는다는 결론을 내렸다. 셋째, 확장집단라이선스(ECL)는 특정 장르에서 시장 실패가 입증될 때에만 선택적으로 도입할 수 있는 대안으로 제시되며, 이 경우 반독점 문제를 완화하기 위한 가이드라인이 필요하다고 권고했다. 넷째, 옵트아웃(opt-out) 제도는 미국 저작권법이 기본적으로 '옵트인(opt-in)' 체계를 취하고 있음을 감안할 때 창작자에게 과도한 부담을 전가할 우려가 있다고 지적했다.
저작권청은 현행 저작권법과 공정이용 원칙만으로도 상당 부분 대응이 가능하므로, 별도의 입법보다는 먼저 시장 주도의 자발적·집단 라이선스 모델이 성숙하도록 지원할 것을 권고했다. 다만 특정 유형의 저작물에서 구조적 시장 실패가 확인될 경우에 한해 ECL 등 '표적형 개입'으로 보완해야 한다는 입장을 밝혔다.
또 위 보고서는 관련한 소송이 2026~2027년경 항소심 판결에 도달할 것으로 전망하면서, 사법적 해석이 확립될 때까지는 유연성과 실험을 허용하는 '후행적·증거 기반' 정책 접근을 제안했는데, 저작권청의 위 보고서는 향후 미국 법원의 판결에 상당한 영향을 줄 것으로 보인다는 점에서 중요한 의미를 가진다고 볼 수 있다.
김경환 법무법인 민후 변호사