Zuckerberg가 Meta의 저작권 침해를 “개인적으로 승인하고 적극적으로 장려했다”

6 days ago 10
  • Meta 와 CEO Mark Zuckerberg 가 AI 시스템 학습을 위해 수백만 권의 책·논문·기사 등 저작물을 불법 복제했다는 혐의로 5개 출판사와 Scott Turow에게 피소됨
  • Meta는 악명 높은 해적 사이트에서 저작권 자료 수백만 건을 토렌트로 내려받고, 무단 웹 스크레이프 자료를 여러 차례 복제해 Llama 학습에 사용했다는 혐의를 받음
  • 소송은 2026년 5월 5일 미국 뉴욕 남부지방법원에 제기됐으며, Hachette, Macmillan, McGraw Hill, Elsevier, Cengage와 Scott Turow가 특정되지 않은 금전적 손해배상을 청구함
  • Meta는 저작권 자료를 AI 학습에 쓰는 것이 공정 이용에 해당할 수 있다는 법원 판단이 있었다며 적극 대응하겠다고 밝혔고, 2025년 6월에는 Llama 학습 관련 저자들의 청구가 기각된 바 있음
  • 이번 소송은 Meta가 라이선스 전략을 검토하다가 Zuckerberg의 개인적 지시로 중단했고, LibGen 사용 위험을 알면서도 267TB가 넘는 해적판 자료 다운로드를 승인했다는 점을 핵심 차별점으로 내세움

소송의 핵심

  • Meta와 CEO Mark Zuckerberg가 AI 시스템 학습을 위해 수백만 권의 책, 논문, 기사 등 저작물을 불법 복제했다는 혐의로 5개 출판사와 작가 Scott Turow에게 피소됨
  • Meta와 Zuckerberg는 생성형 AI 모델을 만들기 위해 “move fast and break things”라는 Meta의 잘 알려진 구호를 따랐고, 악명 높은 해적 사이트에서 저작권이 있는 책과 저널 논문 수백만 건을 토렌트로 내려받았다는 혐의를 받음
  • Meta는 거의 전체 인터넷에 해당하는 무단 웹 스크레이프 자료를 내려받고, 이를 여러 차례 복제해 Meta의 수십억 달러 규모 생성형 AI 시스템 Llama 학습에 사용했다는 혐의를 받음
  • 이 행위는 “역사상 가장 대규모의 저작권 자료 침해 중 하나”로 규정됨

원고와 청구 내용

  • 소송은 2026년 5월 5일 화요일, 미국 뉴욕 남부지방법원에 제기됨
  • 원고는 Hachette, Macmillan, McGraw Hill, Elsevier, Cengage 등 5개 출판사와 Scott Turow 개인임
  • 제안된 집단소송은 저작권 침해 혐의에 대해 특정되지 않은 금전적 손해배상을 청구함
  • 소장 사본은 이 링크에서 제공됨

Meta의 반박과 기존 판례

  • Meta 대변인은 “AI는 개인과 기업을 위한 혁신, 생산성, 창의성을 가능하게 하고 있으며, 법원은 저작권 자료를 AI 학습에 사용하는 것이 공정 이용에 해당할 수 있다고 올바르게 판단해 왔다”고 밝힘
  • Meta는 이 소송에 적극적으로 맞서겠다는 입장임
  • 저자들이 AI 기업을 상대로 저작권 침해 소송을 제기했다가 패소한 사례가 있음
  • 2025년 6월, 연방 판사는 Sarah Silverman과 Junot Díaz를 포함한 13명의 저자가 Meta의 AI 모델 학습이 저작권을 침해했다며 제기한 청구를 기각함
  • 당시 Vincent Chhabria 판사는 Meta가 약 20만 권의 책으로 구성된 데이터셋을 Llama 언어 모델 학습에 사용한 것이 공정 이용에 해당한다고 판결함

이번 소송의 차별점

  • 이번 소송은 Meta와 Zuckerberg가 저작권 보호 장치를 의도적으로 우회했다는 점을 앞세움
  • Meta는 저작물을 라이선스하는 방안을 검토했지만, “Zuckerberg의 개인적 지시”에 따라 그 전략을 포기했다는 혐의를 받음
  • 소송은 문제의 행위가 미국 저작권법상 공정 이용 조항의 보호 범위를 벗어난다고 봄
  • 소장에는 Meta가 Zuckerberg의 지시에 따라 원고와 집단 구성원이 소유하거나 관리하는 저작물을 포함해 수백만 권의 책, 저널 논문, 기타 저작물을 무단 복제했고, Llama 학습을 위해 추가 복제본을 만들었다는 내용이 담김
  • Zuckerberg는 침해를 “개인적으로 승인하고 적극적으로 장려했다”는 혐의를 받음
  • Meta는 훔친 저작물에서 저작권 관리 정보를 제거해 학습 출처를 숨기고 무단 사용을 쉽게 만들었다는 혐의를 받음

라이선스 검토와 중단

  • 소송에 따르면 Meta는 Llama 1 출시 이후 주요 출판사와 라이선스 계약을 맺는 방안을 잠시 검토함
  • Meta는 2023년 1월부터 4월까지 회사의 데이터셋 라이선스 예산을 최대 2억 달러까지 늘리는 방안을 논의함
  • 2023년 4월 초 Meta는 라이선스 전략을 갑자기 중단한 것으로 제시됨
  • 저작권 자료를 앞으로 라이선스할지, 해적판을 사용할지에 대한 문제가 Zuckerberg에게 “상향 보고”됐다고 소장에 적시됨
  • 이 상향 보고 이후 Meta의 사업개발팀은 라이선스 노력을 중단하라는 구두 지시를 받았다고 원고 측이 밝힘
  • 소장에는 한 Meta 직원이 “책 한 권이라도 라이선스하면 공정 이용 전략에 기대기 어려워질 것”이라는 취지로 그 이유를 설명했다는 내용이 포함됨

Meta의 기존 라이선스 경험

  • Meta와 Zuckerberg는 AI 학습 자료 라이선스 시장을 잘 알고 있었다는 점이 제시됨
  • 소장에 따르면 Meta는 2022년에 아프리카 언어권 도서 출판사들과 제한된 학습 세트에 대한 라이선스 4건을 체결함
  • Meta는 이후 Fox News, CNN, USA Today를 포함한 주요 뉴스 출판사들과도 라이선스 계약을 체결함

LibGen 사용과 내부 위험 검토

  • 소장에 따르면 2023년 12월 13일 Meta 직원들은 LibGen 사용의 법적 위험을 다룬 내부 메모를 회람함
  • 해당 Meta 메모는 LibGen을 “우리가 해적판임을 알고 있는 데이터셋”이라고 표현함
  • 같은 메모에는 “학습에 사용된 LibGen 데이터셋 사용 사실을 공개하지 않을 것”이라는 내용도 있었다고 소장에 적시됨
  • 이런 우려는 결국 받아들여지지 않은 것으로 제시됨
  • 소장에 따르면 Zuckerberg와 다른 Meta 임원들은 267TB가 넘는 해적판 자료의 토렌트 다운로드를 승인하고 지시함
  • 이 분량은 수억 건의 출판물에 해당하며, 미국 의회도서관 전체 인쇄 장서 규모의 여러 배에 달한다고 제시됨

Llama 출력물에 대한 주장

  • 침해 혐의의 결과로 Meta의 AI 시스템은 학습에 사용된 원고와 집단 구성원의 저작물을 대체할 수 있는 결과물을 빠르고 대규모로 생성한다는 혐의를 받음
  • 소장에 따르면 이런 대체물에는 원문과 거의 같은 복제물, 학술 교과서의 대체 챕터, 유명 소설과 저널 논문의 요약 및 대안 버전이 포함됨
  • Llama는 원저작물의 창작 요소를 복제한 저품질 모방물과 권리자에게만 배타적으로 허용된 2차적 저작물도 생성한다는 혐의를 받음
  • 소장에 따르면 Llama는 특정 작가의 표현 요소와 창작적 선택을 모방하도록 출력물을 맞춤 생성하기도 함
Read Entire Article