네이버도 외부 인코더 활용 …AI업계 휩쓴 '프롬 스크래치' 논쟁

3 days ago 8

입력2026.01.06 13:45 수정2026.01.06 13:45

네이버클라우드가 자사 독자 인공지능(AI) 파운데이션 모델이 100% 자체 기술로 개발한 '프롬 스크래치'라고 일축했다. 독자 AI 모델 프로젝트가 연이어 자격 논란에 휘말리면서 정부가 프롬 스크래치 기준을 명확히 세워야한다는 지적도 나온다.

네이버클라우드는 “인간 두뇌에 해당하는 AI 파운데이션 모델 핵심 엔진을 프롬 스크래치 단계부터 100% 자체 기술로 개발했다”며 "다만 글로벌 기술 생태계 호환성과 전체 시스템의 효율적인 최적화를 고려해 검증된 외부 인코더를 전략적으로 채택했다"고 설명했다. 중국 알리바바 AI 모델 '큐원 2.5'을 표절했다는 일각의 지적을 반박한 것이다.

최근 업계 일각에선 네이버클라우드의 하이퍼클로바X 시드 32B 싱크 모델이 중국 알리바바의 큐웬 2.4 언어모델과 비전 인코더 웨이트(가중치) 코사인 유사도와 피어슨 상관계수가 높다는 주장이 나왔다. 하이퍼클로바X와 큐웬 2.4 언어모델의 코사인 유사도와 피어슨 상관계수가 높아 비전 인코더와 가중치(웨이트)를 사용한 것으로 해석됐다.

이에 대해 네이버는 외부 인코더를 활용한 게 이미 표준화된 고성능 모듈을 활용해 전체 모델 완성도와 안정성을 높이기 위한 고도의 엔지니어링 판단이었다는 입장이다. 네이버클라우드 측은 “외부 인코더 채택은 글로벌 AI업계에서도 시스템 확장성을 위한 보편적 설계 표준으로 자리 잡고 있다”며 “알리바바 큐원2-오디음가 오픈AI 음성인식 기술 '위스퍼'를, 큐원3-옴니는 구글의 이미지 인식 기술 'SigLIP2'를 기반으로 구축했다”고 설명했다.

AI 업계에선 정부가 예산을 투입하는 소버린AI 프로젝트에서 기술 활용 기준을 더 명확히 해야한다는 목소리가 나온다. 오픈소스 기술을 참고해서 만든 독자 AI모델이 있더라도 만약 오픈소스를 더 이상 활용하지 못 할 경우 문제가 생기면 소버린 AI의 의미가 퇴색된다는 지적이다. 오픈소스 구조를 참고해 모델을 학습하는 것은 개발 효율성과 호환성을 위해 필요하지만 그 기준이 명확해야한다는 얘기다. AI 업계 관계자는 "인코더를 활용하는 게 어느 정도로 성능에 영향을 주는지는 전문가마다 의견이 갈린다"며 "정부가 명확한 선을 그어줄 필요가 있다"고 말했다.

고은이 기자 koko@hankyung.com

Read Entire Article