GitHub에서 10억 번째 저장소 생성 축하

1 day ago 4

Hacker News 의견
  • 100,000,000번째 OpenStreetMap changeset이 생각나는 경험 공유, 나와 몇몇 사람들이 이 기록을 노렸지만 실제로는 아무것도 신경 안 쓰고 아프리카 매핑에 열중하던 사람이 차지한 이야기, 시간이 지나고 보니 더 훈훈한 결말로 느껴짐, 이 사람은 과거에도 OSM 상을 받은 후보였던 분, OpenStreetMap은 모든 변경이 실시간 프로덕션에 적용되기 때문에 의미 없는 기여를 하기가 어려운 구조라서 오히려 우연에 의해 milestone number를 차지하는 경우가 많음, Github의 이런 이정표도 재밌는 성과라고 생각, OSM milestone에 관심 있다면 공식 블로그내가 정리한 글 참고 추천
  • 깃허브 저장소 ID 숫자가 overflow할 정도를 이야기하면서, 앞으로 10억 개 더 생성되면 깃허브 OpenAPI Spec도 int32 한계 넘는 현상 발생 가능성 언급, 참고: 관련 이슈
    • 예전에 CTO로 일하던 회사에서 32비트 정수(primary key)를 주요 테이블에 쓰고 있었는데 벌써 13억 개나 쌓여 있어서, 이대로 가면 몇 달 내로 overflow 문제가 발생할 뻔한 경험, 급히 64비트로 확장해서 큰 사고를 막았던 기억
  • 재미로 깃허브 저장소 ID의 시작을 공유, 첫 번째 저장소는 API에서 직접 보기, 저장소 주소는 여기
  • 깃허브에서 저장소 생성 속도를 계산하는 게 너무 쉽다는 점이 놀라움, 이런 정보는 보통 기업의 비밀로 취급된다고 생각
    • 깃허브 같은 서비스가 어마어마하게 커지면, (정보 공개에) 좀 더 느긋한 경향이 생긴다는 유쾌한 비유
    • 깃허브가 이런 정보를 굳이 숨길 이유가 있을지 궁금증, 이런 데이터로 깃허브에 타격을 줄 활용이 가능할지 의문, 많은 기업들이 원칙적으로 정보를 최소 공개하는 경향 있다는 배경
  • 전체적으로는 각각의 서버(Forgejo, Gitlab 포함)에 실제로 몇 개의 저장소가 존재하는지 궁금증, 경우에 따라 Subversion, Mercurial, git까지 포함한 범주로 언급, 혹시 이런 분산된 저장소를 검색하는 엔진이 만들어진 적 있는지, 단순히 'a'라는 단어를 검색하는 방식으로 전체 규모 추정 가능성, Github처럼 중앙 집중된 플랫폼에서는 오픈소스 코드 찾기가 쉬운 점이 장점이라고 느꼈고, MS의 Github 인수 후 직접 검색 엔진을 만들까 고민했지만 홍보가 어려워 포기한 경험, 최근 codeberg에 여러 프로젝트를 올리면서 다시 관심 생겼지만 이미 누군가 만들었을지도 모른다는 생각
  • AasishPokhrel이 10억 번째 저장소 기록을 노리고 만든 건 아닌지 궁금증
    • 실제로 이런 걸 노리기는 쉽다는 설명, 계속 저장소를 만들다 보면 언젠가는 해당 번호를 차지할 수 있음, 동시에 다른 사람도 생성 중이기 때문에 결국 운의 영역, API 지원으로 시도 자체는 간단, 다만 속도 제한(rate limits)이 변수
    • AasishPokhrel이 어제 'shit'과 'yep'이라는 두 저장소를 만든 기록, 5월 17일부터 6월 10일까지는 활동이 없다가 새로 만든 점, 특정 번호 저장소를 노리고 타이밍을 맞추는 게 정말 가능할지 확신은 없다고 전언
    • AasishPokhrel이 네팔에서 소프트웨어 개발을 공부하는 대학생이라고 알고 있는데, 이런 글로벌 milestone이 지구 반대편까지 닿았다는 점에 감동, 이 기록이 그의 이력서에 크게 남아서 좋은 개발 커리어로 이어지기를 응원
    • 실제로 노렸을 가능성은 낮은 것 같지만 불가능하다고 할 수는 없을 듯한 의견
  • 아마 스크립트로 https://api.github.com/repositories/999999999 같은 주소를 계속 체크하다가 해당 번호가 생기면 바로 저장소를 만든 방식일 것으로 추정, 저장소를 여러 개 만들고 맞춤 번호만 남기고 삭제하는 식으로도 가능, 어제 만든 다른 저장소 기록을 보면 'yep'을 milestone 번호로 남기려 했던 것 같고, 'shit'은 실패했음을 인정하는 이름이 아닐까 추측, 과거 Facebook의 D666666 codemod 사례와 같은 숫자 맞추기 기법 언급
  • ‘세 개의 콤마(,) 클럽’이라는 의미로 10억 번째 저장소를 표현
    • 스페인어 농담으로 ‘Tres commas’(세 콤마) 언급

Read Entire Article