리우데자네이루의 “자체 개발” LLM이 기존 모델의 병합으로 보임

1 hour ago 3
  • GitHub 상태는 Open이며, a778c1ec4e21180ee55c3ea016a348e549e75f09 README 문구는 모델이 Nex-N2-ProQwen3.5-397B-A17B의 병합으로 만들어졌고 더 강한 모델의 On-Policy Distillation을 거쳤으며 이전 버전에 최종 distilled 모델 대신 base merged version이 잘못 업로드됐다고 기재
  • 핵심 문제 제기는 prefeitura-rio/Rio-3.5-Open-397B가 IplanRIO가 학습한 original 397B model로 제시됐지만, 가중치가 Nex와 Qwen의 약 0.6/0.4 직접 원소별 병합이고 자체 학습 증거가 없다는 것
  • 하드코딩된 “You are Rio” 시스템 프롬프트를 제거하고 rio-397b에 120개 정체성 질문을 보낸 결과, Nex 응답 79.2% (95/120), Nex-AGI 응답 73.3% (88/120), Rio 응답 0.0% (0/120)이었다는 측정 결과
  • 프롬프트 제거 상태의 응답 예시는 “I am Nex, from Nex-AGI”와 “Nex-AGI is a large-model ecosystem alliance” 및 “Shanghai Innovation Institute”를 포함했으며, 해당 문구가 Nex identity data의 조직 설명을 거의 그대로 재현했다는 사례
  • 가중치 분석은 (Rio − Qwen) = α × (Nex − Qwen) 관계를 텐서별로 측정했고, cos_fit이 독립 모델에서는 ≈ 0, 병합에서는 ≈ 1이라는 기준으로 collinearity를 비교한 방식
  • 측정값은 routed experts에서 α = 0.571 ± 0.0016, cos_fit = 0.993, lm_head에서 α = 0.574, cos_fit = 0.991, attention에서 α ≈ 0.585, cos_fit ≈ 0.986, linear-attention projections에서 α ≈ 0.586, cos_fit ≈ 0.984라는 수치
  • README 수정 공유 뒤 00INDEX는 해당 credit이 한 시간 전에 업데이트된 것을 말하는지 되물었고, yhcc는 다음 날 모델 업로드 여부를 보자는 반응
  • 공공자금 여부는 별도 쟁점으로 이어졌으며, 한 댓글은 “No public funds were used”라고 적힌 X 링크를 공유했고 다른 댓글은 시장 발언 X 링크를 제시했으며, 이후 인용 이미지에는 “no public money was spent on this model training” 문구가 포함됨
Read Entire Article