AI 크롤러가 트래픽을 지배해 일부 국가 차단 조치

4 days ago 6

오픈 소스 개발자들이 AI 크롤러 트래픽에 맞서 싸우는 이유

AI 크롤러의 문제점: 소프트웨어 개발자 Xe Iaso는 Amazon의 공격적인 AI 크롤러 트래픽으로 인해 Git 저장소 서비스가 불안정해지고 다운타임이 발생하는 문제를 겪음. 표준 방어 조치를 설정했음에도 불구하고 AI 크롤러는 사용자 에이전트를 속이고 주거 IP 주소를 프록시로 사용하여 모든 차단 시도를 회피함.
Anubis 시스템 도입: Iaso는 VPN 뒤로 서버를 이동하고 "Anubis"라는 맞춤형 작업 증명 시스템을 만들어 사이트에 접근하기 전에 웹 브라우저가 계산 퍼즐을 해결하도록 함. 이는 AI 크롤러를 차단하기 위한 절박한 시도로, AI 크롤러가 거짓말을 하고 사용자 에이전트를 변경하며 주거 IP 주소를 프록시로 사용하는 등의 문제를 해결하기 위함임.
오픈 소스 커뮤니티의 위기: AI 크롤러가 커뮤니티 유지 인프라를 과부하시키고 있으며, 이는 지속적인 분산 서비스 거부(DDoS) 공격과 유사한 문제를 야기함. LibreNews의 보고서에 따르면, 일부 오픈 소스 프로젝트는 AI 회사의 봇으로부터 오는 트래픽이 전체의 97%에 달하며, 이는 대역폭 비용 증가, 서비스 불안정성, 유지 관리자의 부담을 가중시킴.
Anubis의 효과와 한계: GNOME GitLab은 Anubis 시스템을 도입하여 브라우저가 콘텐츠에 접근하기 전에 계산 퍼즐을 해결하도록 요구함. 그러나 많은 사용자가 동시에 링크에 접근할 경우 지연이 발생할 수 있으며, 모바일 사용자는 작업 증명 완료를 위해 최대 2분을 기다려야 하는 경우도 있음.
AI 크롤러의 책임 문제: AI 회사들은 데이터 수집을 위해 웹 크롤링을 수행하며, 이는 대규모 언어 모델을 구축하거나 실시간 검색을 수행하기 위한 것으로 추정됨. 그러나 이러한 크롤링은 지속적인 데이터 수집을 나타내며, 일부 회사는 더 공격적인 접근 방식을 취함.
방어 도구의 개발: AI 크롤러에 맞서기 위해 새로운 방어 도구들이 개발되고 있음. 예를 들어, "Nepenthes"는 AI 크롤러를 가짜 콘텐츠의 미로에 가두는 도구로, AI 회사의 자원을 낭비하게 만듦. Cloudflare는 "AI Labyrinth"라는 상업적으로 다듬어진 접근 방식을 발표하여 웹사이트 소유자를 보호함.
협력의 필요성: AI 회사들이 오픈 소스 프로젝트와 협력하여 데이터 수집을 책임감 있게 수행할 수 있다면, 디지털 생태계의 지속 가능성을 위협하는 문제를 해결할 수 있을 것임. 그러나 현재로서는 AI 회사들이 협력적인 관행을 채택할 동기가 부족하며, 데이터 수집을 둘러싼 경쟁이 심화될 가능성이 있음.

Read Entire Article

AI 크롤러가 트래픽을 지배해 일부 국가 차단 조치

오픈 소스 개발자들이 AI 크롤러 트래픽에 맞서 싸우는 이유

Related

누구나 당신의 휴대폰에 있는 모든 앱을 안다면

규모 7.7 지진, Southeast Asia 강타하여 Myanmar 및 Thailand 영향

Plain - 파이썬용 웹 프레임워크

HN 공개: ESP32와 e-paper 화면을 활용한 물리적 포모도로 타이머

애플의 Severance가 원격 데스크톱에서 편집되는 이유

Xee - Rust로 구현된 최신 XPath 및 XSLT 엔진

Microsoft, Windows 11 설치시에 로컬 계정 생성을 우회하던 구멍 차단 예정

TracePerf - Node.js용 성능 추적/실행 모니터링 도구

Tips

게임 정보

취업 정보

온라인 툴

유용한 정보

유튜브

Trending

Popular

SAP Datasphere: Top New Features | February 2025

“美 F-35 전투기 구매 재검토한다”…캐나다, 트럼프 압박 대응 나서나

전직 페이스북 이사의 새 책, 마크 저커버그의 냉혹한 이미지 묘사

How to Best Navigate the Journey to SAP S/4HANA: Expert Guid...

Automation Makes Intercompany Accounting a Whole Lot Easier ...

How to Post from SAP Payroll to Multiple General Ledgers

Best Aids to Prepare for SAP C_BCHCM_2502 Exam

SAP C_BCSBS_2502 Exam Success: The Importance of Practice Te...

The Future of AI for Talent Management: Shifting Perspective...

Joule for Developers: The Trusted AI Assistant for SAP Devel...