Zuckerberg가 Meta의 저작권 침해를 “개인적으로 승인하고 적극적으로 장려했다”

6 days ago 10

Meta 와 CEO Mark Zuckerberg 가 AI 시스템 학습을 위해 수백만 권의 책·논문·기사 등 저작물을 불법 복제했다는 혐의로 5개 출판사와 Scott Turow에게 피소됨
Meta는 악명 높은 해적 사이트에서 저작권 자료 수백만 건을 토렌트로 내려받고, 무단 웹 스크레이프 자료를 여러 차례 복제해 Llama 학습에 사용했다는 혐의를 받음
소송은 2026년 5월 5일 미국 뉴욕 남부지방법원에 제기됐으며, Hachette, Macmillan, McGraw Hill, Elsevier, Cengage와 Scott Turow가 특정되지 않은 금전적 손해배상을 청구함
Meta는 저작권 자료를 AI 학습에 쓰는 것이 공정 이용에 해당할 수 있다는 법원 판단이 있었다며 적극 대응하겠다고 밝혔고, 2025년 6월에는 Llama 학습 관련 저자들의 청구가 기각된 바 있음
이번 소송은 Meta가 라이선스 전략을 검토하다가 Zuckerberg의 개인적 지시로 중단했고, LibGen 사용 위험을 알면서도 267TB가 넘는 해적판 자료 다운로드를 승인했다는 점을 핵심 차별점으로 내세움

소송의 핵심

Meta와 CEO Mark Zuckerberg가 AI 시스템 학습을 위해 수백만 권의 책, 논문, 기사 등 저작물을 불법 복제했다는 혐의로 5개 출판사와 작가 Scott Turow에게 피소됨
Meta와 Zuckerberg는 생성형 AI 모델을 만들기 위해 “move fast and break things”라는 Meta의 잘 알려진 구호를 따랐고, 악명 높은 해적 사이트에서 저작권이 있는 책과 저널 논문 수백만 건을 토렌트로 내려받았다는 혐의를 받음
Meta는 거의 전체 인터넷에 해당하는 무단 웹 스크레이프 자료를 내려받고, 이를 여러 차례 복제해 Meta의 수십억 달러 규모 생성형 AI 시스템 Llama 학습에 사용했다는 혐의를 받음
이 행위는 “역사상 가장 대규모의 저작권 자료 침해 중 하나”로 규정됨

소송은 2026년 5월 5일 화요일, 미국 뉴욕 남부지방법원에 제기됨
원고는 Hachette, Macmillan, McGraw Hill, Elsevier, Cengage 등 5개 출판사와 Scott Turow 개인임
제안된 집단소송은 저작권 침해 혐의에 대해 특정되지 않은 금전적 손해배상을 청구함
소장 사본은 이 링크에서 제공됨

Meta 대변인은 “AI는 개인과 기업을 위한 혁신, 생산성, 창의성을 가능하게 하고 있으며, 법원은 저작권 자료를 AI 학습에 사용하는 것이 공정 이용에 해당할 수 있다고 올바르게 판단해 왔다”고 밝힘
Meta는 이 소송에 적극적으로 맞서겠다는 입장임
저자들이 AI 기업을 상대로 저작권 침해 소송을 제기했다가 패소한 사례가 있음
2025년 6월, 연방 판사는 Sarah Silverman과 Junot Díaz를 포함한 13명의 저자가 Meta의 AI 모델 학습이 저작권을 침해했다며 제기한 청구를 기각함
당시 Vincent Chhabria 판사는 Meta가 약 20만 권의 책으로 구성된 데이터셋을 Llama 언어 모델 학습에 사용한 것이 공정 이용에 해당한다고 판결함

이번 소송은 Meta와 Zuckerberg가 저작권 보호 장치를 의도적으로 우회했다는 점을 앞세움
Meta는 저작물을 라이선스하는 방안을 검토했지만, “Zuckerberg의 개인적 지시”에 따라 그 전략을 포기했다는 혐의를 받음
소송은 문제의 행위가 미국 저작권법상 공정 이용 조항의 보호 범위를 벗어난다고 봄
소장에는 Meta가 Zuckerberg의 지시에 따라 원고와 집단 구성원이 소유하거나 관리하는 저작물을 포함해 수백만 권의 책, 저널 논문, 기타 저작물을 무단 복제했고, Llama 학습을 위해 추가 복제본을 만들었다는 내용이 담김
Zuckerberg는 침해를 “개인적으로 승인하고 적극적으로 장려했다”는 혐의를 받음
Meta는 훔친 저작물에서 저작권 관리 정보를 제거해 학습 출처를 숨기고 무단 사용을 쉽게 만들었다는 혐의를 받음

소송에 따르면 Meta는 Llama 1 출시 이후 주요 출판사와 라이선스 계약을 맺는 방안을 잠시 검토함
Meta는 2023년 1월부터 4월까지 회사의 데이터셋 라이선스 예산을 최대 2억 달러까지 늘리는 방안을 논의함
2023년 4월 초 Meta는 라이선스 전략을 갑자기 중단한 것으로 제시됨
저작권 자료를 앞으로 라이선스할지, 해적판을 사용할지에 대한 문제가 Zuckerberg에게 “상향 보고”됐다고 소장에 적시됨
이 상향 보고 이후 Meta의 사업개발팀은 라이선스 노력을 중단하라는 구두 지시를 받았다고 원고 측이 밝힘
소장에는 한 Meta 직원이 “책 한 권이라도 라이선스하면 공정 이용 전략에 기대기 어려워질 것”이라는 취지로 그 이유를 설명했다는 내용이 포함됨

침해 혐의의 결과로 Meta의 AI 시스템은 학습에 사용된 원고와 집단 구성원의 저작물을 대체할 수 있는 결과물을 빠르고 대규모로 생성한다는 혐의를 받음
소장에 따르면 이런 대체물에는 원문과 거의 같은 복제물, 학술 교과서의 대체 챕터, 유명 소설과 저널 논문의 요약 및 대안 버전이 포함됨
Llama는 원저작물의 창작 요소를 복제한 저품질 모방물과 권리자에게만 배타적으로 허용된 2차적 저작물도 생성한다는 혐의를 받음
소장에 따르면 Llama는 특정 작가의 표현 요소와 창작적 선택을 모방하도록 출력물을 맞춤 생성하기도 함