- Anna’s Archive가 Google Books 전체 도서 스캔 또는 비슷한 규모의 컬렉션 확보에 20만 달러 보상금을 걸었음
- 현재 Google Books 접근은 검색 결과 주변의 작은 스니펫 중심이라, 전체 스캔 확보가 아카이브 관점에서 핵심 과제로 다뤄짐
- 확장 가능한 방법을 찾았다면 완성본을 기다리지 말고 프로토타입 단계에서 연락하라고 안내함
- Google 내부 접근권한이 있는 사람도 대상이며, 이미지 없이 OCR 텍스트만 확보해도 보상금의 절반을 지급할 수 있음
- 대상은 Google Books에만 묶이지 않고, AI 기업 등이 모은 희귀 도서 포함 대규모 컬렉션에도 적용됨
보상금 대상과 참여 조건
- Anna’s Archive는 Google Books 또는 유사한 전체 도서 스캔 확보에 $200,000 보상금을 제시함
- 작업 전에는 Anna’s Archive의 bounties 안내를 주의 깊게 읽어야 함
- Google Books는 많은 스캔 도서를 보유하지만, 검색으로 접근할 때 결과 주변의 작은 스니펫만 보이는 상태임
- 확장 가능성이 있는 방법을 찾았다면 완성본까지 기다리지 말고 프로토타입으로 일찍 연락하라고 안내함
- Anna’s Archive가 이후 확장 작업을 도울 수 있음
- Google에서 일하며 해당 데이터에 접근할 수 있는 사람도 보상 대상에 포함됨
- $200,000이 큰 금액이 아닐 수 있지만, 데이터를 반출할 수 있다면 “전설적인 아키비스트”로 불릴 것이라고 적었음
- 보상금은 Google Books 외의 비슷한 규모 컬렉션에도 적용됨
- 예시로 AI 기업들이 수집한 컬렉션을 들었음
- 특히 희귀 도서를 상당히 포함한 컬렉션이면 대상이 됨
댓글에서 정리된 규모와 전달 방식
- 한 댓글은 전체 아카이브가 저작권 자료를 포함해 약 7PB라고 썼지만, 이후 약 1.5PB이며 IUPUI 사이트의 복제를 포함한 수치라고 정정함
- 공개 도메인 및 저자 공개 자료는 약 300TB 규모로 언급됨
- Anna’s Archive는 공개 도메인 및 저자 공개 자료에 아직 스크랩이 없다면 별도 보상금을 추가할 의향이 있다고 답함
- 전체 이미지가 아니라 OCR 텍스트만 반출하는 경우에도 이 보상금 목적상 절반을 지급할 수 있음
- 대량 데이터를 확보했을 때의 전달 방식으로는 SFTP 또는 유사한 방식이 언급됨
- 이슈 제목은 2025년 6월 7일 Google Books (or similar) all book scans — $200,000 bounty로 변경됨

1 hour ago
3


![[속보] 北, 韓·EU성명에 “체제존중 위장 내던져…韓 적대 원칙 불변”](https://pimg.mk.co.kr/news/cms/202606/13/news-p.v1.20260613.89255ddca2b0487c98e7f979e85a8a39_R.jpg)





English (US) ·