AI 학습을 위해 사용되는 저작물 – 어디까지가 ‘공정이용’일까? [지평 테크레이더]

3 weeks ago 17

AI 학습을 위해 사용되는 저작물 – 어디까지가 ‘공정이용’일까? [지평 테크레이더]

허종 법무법인 지평 변호사

입력 : 2026.05.14 07:00

AI 학습의 핵심 쟁점, ‘공정이용’의 부상

AI 기술의 발전 속도가 놀라운 수준이라는 것은 더 이상 설명할 필요가 없는 시대다. AI 기술 발전의 땔감이 되고 있는 것은 저작물이다. AI 개발회사에서 타인의 저작물을 권리자의 동의 없이 AI 학습데이터로 활용하게 될 경우, 저작권자 권리 침해 소지가 있다. 그렇다고 하여 모든 저작물의 이용에 관하여 권리자의 무조건적인 이용통제권을 허용할 경우, 저작물을 통한 변형적 창작 활동이나 새로운 부가가치 창출 기회를 가로막을 수 있다.

이에, 현 AI 시대에 다시금 각광을 받고 있는 저작권법상의 규정이 바로 이 ‘공정이용(Fair Use)’ 조항이다. ‘공정이용’이란 저작물 권리자의 정당한 이익을 부당하게 해치지 않고 해당 저작물의 일반적인 이용 방법과 충돌하지 않을 경우 허용되는 자유이용행위를 의미한다. AI 모델 학습을 위해 타인의 저작물을 활용한다고 해도 이 ‘공정이용’에 해당한다면, 저작권침해는 성립하지 않는다. 때문에, 많은 AI 개발사들은 ‘공정이용’을 주장하고 있고, 저작권자들은 ‘공정이용’에 해당하지 않는다며 다투고 있다.

국내의 경우, 네이버가 지상파 3사의 뉴스데이터를 AI 모델 학습에 활용한 것이 저작권침해에 해당하는지에 관한 소송이 가장 유명하다. 이 소송에서도 ‘공정이용’ 해당 여부가 핵심 쟁점이 되고 있으나, 아직 1심 판결이 나오지는 않았다.

미국 판례로 본 ‘변형적 이용’ 판단 기준

반면, 미국의 경우 저작물을 AI 학습데이터로 활용한 것이 ‘공정이용’에 해당하는지에 관한 판례들이 속속 나오고 있다. 위 판례들은 국내 AI 사업자들 및 법률가들에게 하나의 중요한 참고가 되고 있다.

가장 유명한 판결은 2025년 6월 23일자로 선고된 바츠(Bartz, 아래 도서의 저자 중 1인의 이름) vs 앤트로픽(Anthropic PBC) 간의 저작권침해 소송이다. 대형 AI기업인 앤트로픽사는 약 700만 권의 책을 구입하거나 무단 다운로드하여, 이를 스캔한 뒤 중앙라이브러리에 보관하여, LLM(거대 언어모델) 학습데이터로 활용했다. 중앙라이브러리에 저장하는 과정에서도, 학습데이터로 활용하는 과정에서도 위 책들은 기술적으로 ‘복제’되기 때문에, 법적 형식상 저작권침해가 될 수 있다.

그러나 법원(캘리포니아 북부 연방법원)은 앤트로픽이 위 구입한 책들을 보관하여 학습데이터로 활용한 행위는 ‘공정이용’에 해당한다고 판시했다. 거대언어 모델의 학습을 위해서만 활용하였을 뿐, 끌로드 모델에서 산출된 결과물이 원저작물을 그대로 재현하거나 대체하지 않고, 그 생성된 결과물이 ‘극도로 변형적’(exceedingly transformative)이기 때문에, 이용목적과 방법이 원저작물의 일반적 이용방법과 충돌하지 않는다고 보았다.

또한 해당 AI 서비스가 학습 대상이 된 원저작물의 시장이나 수요를 대체할 우려가 없다고 보았다.(다만, 정당한 대가를 지급하고 구매하지 않고 불법 복제하여 라이브러리에 저장한 해적판 책의 경우, AI 학습데이터 활용 여부와 무관하게, 그 행위 자체가 저작물에 대한 복제권 침해가 성립할 수 있다고 봤다.)

이 판결을 통해 ‘원저작물 – AI 모델 학습 – 생성된 결과물’ 간에 ‘변형의 정도’가 매우 중요한 판단의 기준으로 정립되었다.

반면, ‘비변형적 이용’(Non-transformative use)에 해당한다는 이유로 ‘공정이용’ 항변을 배척한 사례도 있다. 바로 같은 해 2월 11일 선고된 톰슨 로이터와 로스 인텔리전스(Thomson Reuters Enterprise GmbH vs ROSS Intelligence Inc.) 간의 분쟁이다. 법률검색 플랫폼으로 저명한 웨스트로(Westlaw) 운영사인 톰슨 로이터는 ROSS가 Westlaw에서 제공하는 판례요약(헤드노트)를 무단으로 이용하여 저작권을 침해했다고 주장하며 소송을 제기했다. ROSS는 위 헤드노트가 수치 가중치 생성을 위해서만 복제되었을 뿐 이용자에게 표시되지 않았고, 산출된 결과물은 Westlaw의 DB가 아닌 AI도구에 불과하다며 변형적 이용을 주장했다. 하지만 법원(델라웨어 연방법원)은 위 ROSS의 AI 시스템은 새로운 결과물을 창작하는 생성형 AI가 아니라, 시중의 법률문서를 검색하여 재현적인 값을 보여주는 시스템이라는 점에서, 비변형적 이용에 해당한다고 판시했다. 더 나아가, ROSS의 법률 AI 검색 시스템은 Westlaw와 사실상 동일한 기능을 제공하고 있어, 경쟁시장 내 원고 서비스의 시장잠식 내지 수요대체 우려가 크다고 보고, 이를 공정이용 항변을 배척하는 중요 논거로 삼았다. 또한 ROSS가 당초에는 톰슨 로이터로부터 해당 데이터셋에 대한 라이선스를 받아 AI 검색 시스템을 개발하려 했다가 실패했던 정황 역시, 피고에게 불리하게 작용했다.

이러한 경향은 2025년 6월 25일 선고된 소설가 리처드 카드리 등과 메타(Kadrey, et al. vs. Meta Platforms Inc.) 사례에서도 확인할 수 있다. 위 판결에서 법원(캘리포니아 북부 연방법원)은, 앞서 본 바츠 대 앤트로픽 사례에서와 마찬가지로, 원저작물(도서)을 메타의 거대언어모델 학습을 위해 활용하는 것은 ‘고도의 변형적’(highly transformative) 활용에 해당한다는 이유로 메타의 공정이용 항변을 인용했다. 그러면서도 원고 패소 이유 부분에, 메타의 서비스가 원저작물 시장에 미칠 잠재적 수요대체 효과나 해당 도서들과 관련된 라이선싱 시장의 존재 등에 관한 쟁점이 충분히 부각되지 못하였다는 취지도 부기함으로써, 시장잠식 내지 수요대체, 라이선싱 시장의 존재 등이 중요한 쟁점이 된다는 점을 재차 확인했다.

공정이용 판단을 위한 세 가지 나침반

결론을 달리했던 위 사례들이 앞으로의 분쟁에 어떤 나침반 역할을 할지 명확하지는 않다. 다만, 1) AI 학습을 통해 산출된 결과물이 원저작물과의 관계에서 어느 정도나 변형적인지, 2) 방대한 분량의 저작물을 학습한 결과 개발된 AI 시스템이 원저작자가 제공하는 상품ㆍ서비스 시장을 잠식하거나 이의 수요를 대체할 우려는 없는지, 3) 라이선스 계약 등을 통해 원저작자의 경제적 수익실현 기회를 박탈하였는지 등이, 공정이용 해당 여부 판단에 있어 중요한 고려요소들로 정착했음을 알 수 있다. 이는 미국과 사실상 유사한 공정이용 법체계를 갖고 있는 국내에도 시사하는 바가 적지 않다 하겠다.

[지평 테크레이더]에서는 AI, 데이터, 디지털 기술 발전에 따라 급변하는 법·제도 환경을 기업ㆍ기관 실무자가 이해하기 쉬운 형태로 전달하고자 합니다. 허종 변호사는 지평 IP·IT 부그룹장으로 IP·IT, 엔터테인먼트&미디어, 제약·바이오·의료 분야 자문 및 소송 업무 등을 수행하고 있습니다.