리우데자네이루의 “자체 개발” LLM이 기존 모델의 병합으로 보임

4 weeks ago 37

GitHub 상태는 Open이며, a778c1ec4e21180ee55c3ea016a348e549e75f09 README 문구는 모델이 Nex-N2-Pro와 Qwen3.5-397B-A17B의 병합으로 만들어졌고 더 강한 모델의 On-Policy Distillation을 거쳤으며 이전 버전에 최종 distilled 모델 대신 base merged version이 잘못 업로드됐다고 기재
핵심 문제 제기는 prefeitura-rio/Rio-3.5-Open-397B가 IplanRIO가 학습한 original 397B model로 제시됐지만, 가중치가 Nex와 Qwen의 약 0.6/0.4 직접 원소별 병합이고 자체 학습 증거가 없다는 것
하드코딩된 “You are Rio” 시스템 프롬프트를 제거하고 rio-397b에 120개 정체성 질문을 보낸 결과, Nex 응답 79.2% (95/120), Nex-AGI 응답 73.3% (88/120), Rio 응답 0.0% (0/120)이었다는 측정 결과
프롬프트 제거 상태의 응답 예시는 “I am Nex, from Nex-AGI”와 “Nex-AGI is a large-model ecosystem alliance” 및 “Shanghai Innovation Institute”를 포함했으며, 해당 문구가 Nex identity data의 조직 설명을 거의 그대로 재현했다는 사례
가중치 분석은 (Rio − Qwen) = α × (Nex − Qwen) 관계를 텐서별로 측정했고, cos_fit이 독립 모델에서는 ≈ 0, 병합에서는 ≈ 1이라는 기준으로 collinearity를 비교한 방식
측정값은 routed experts에서 α = 0.571 ± 0.0016, cos_fit = 0.993, lm_head에서 α = 0.574, cos_fit = 0.991, attention에서 α ≈ 0.585, cos_fit ≈ 0.986, linear-attention projections에서 α ≈ 0.586, cos_fit ≈ 0.984라는 수치
README 수정 공유 뒤 00INDEX는 해당 credit이 한 시간 전에 업데이트된 것을 말하는지 되물었고, yhcc는 다음 날 모델 업로드 여부를 보자는 반응
공공자금 여부는 별도 쟁점으로 이어졌으며, 한 댓글은 “No public funds were used”라고 적힌 X 링크를 공유했고 다른 댓글은 시장 발언 X 링크를 제시했으며, 이후 인용 이미지에는 “no public money was spent on this model training” 문구가 포함됨

Read Entire Article

리우데자네이루의 “자체 개발” LLM이 기존 모델의 병합으로 보임

Related

스마트 가전을 점검해봐야 할지도 모른다

우리는 너무 많은 생각을 AI에 떠넘기고 있는가?

코드를 거의 보지 않고 만든 70배 빠른 SQL 파서

Physical AI의 머니볼

예측 불가능한 천재를 감싸는 법

소프트웨어가 세상을 먹어 치웠고, 이제 하드웨어가 소프트웨어를 먹고 있다

나는 USB-C 맥시멀리스트다

Show GN: K리그 일정 캘린더(URL 구독)

Tips

Trending

Popular

Cafe24, LLM Router 공개

예약부터 결과 상담까지…KMI, ISO 9001 인증 획득

[2026/06/08 ~ 14] 이번 주에 살펴볼 만한 AI/ML 논문 모음

You have 3-5 seconds to build trust 🤝

Weave Robotics, $7,999 가정용 로봇 Isaac 1 출시 (2026년 가을 배송 예정)

Generative AI Hub for Enterprise AI Development

AI Agents to Take Over 100,000 Manual Order Confirmations at...

What SAP S/4HANA Certification Really Costs: Exam Fees, Trai...

SAP ABAP Application Development with AI-DLC (AI-Driven Deve...

Separating Fact From Fiction: What Breweries Should Know Abo...