네이버도 독자 AI 논란… ‘프롬스크래치’ 도마에

글자 크기
네이버, 인코더 中오픈소스서 채택 소버린 AI모델 기준 구체화 목소리
국내 독자 인공지능(AI) 파운데이션 모델을 개발하는 정부 프로젝트 과정에서 ‘독자 개발’ 기준에 대한 논쟁이 이어지고 있다. 업스테이지가 중국 모델을 표절했다는 주장이 제기되고 회사 대표가 직접 이를 반박한 데 이어 네이버가 음성·이미지 처리 기능을 중국 모델에서 가져오며 논란이 재점화했다.

6일 정보통신기술(ICT) 업계에 따르면 네이버클라우드 하이퍼클로바X 시드 32B 싱크 모델이 중국 알리바바의 큐웬 2.4 언어모델과 비전 인코더 웨이트(가중치)의 코사인 유사도와 피어슨 상관계수가 높다는 주장이 나왔다. 실제 데이터값 분포 등 데이터 유사성이 높다는 의미다.

이에 대해 네이버클라우드는 중국 오픈소스에서 일부 인코더를 가져왔다고 밝혔다. 회사 측은 “글로벌 기술 생태계와의 호환성 및 전체 시스템의 효율적 최적화를 고려해 외부 인코더를 전략적으로 채택했다”며 “VUClip과 같은 독자적인 비전 기술력을 보유하고 있지만 모델 완성도와 안전성을 높이기 위한 판단”이라고 설명했다.

업계 안팎에서도 이런 방식의 설계가 통용되는 것으로 보고 있다. 다만 정부가 독자 모델 평가 요소로 프롬스크래치 방식을 제시했는데, 이를 충족하는지를 두고 논쟁이 계속되는 중이다. 프롬스크래치는 기존 모델의 ‘가중치’를 재사용하지 않고 데이터를 처음부터 학습해 아키텍처 등을 자체 구축하는 것을 의미한다. 소버린(주권형) AI 모델을 결정하는 주요 요소이지만 자립 개발 수준을 평가하는 기준이 명확히 있지는 않다.

이정한 기자 han@segye.com

HOT 포토

더보기