[출처=NC AI]인공지능(AI) 기업 ‘NC AI’는 산업 현장용 독자 AI 파운데이션 모델(여러 서비스 기반이 되는 대형 AI) ‘배키(VAETKI)’를 공개했다고 8일 밝혔다. 제조·국방·유통·콘텐츠 등 산업별 보안·업무 특수성을 반영한 ‘산업형 소버린 AI(자체 통제 가능한 AI)’를 표방했다.
배키는 1000억개(100B) 파라미터(모델 규모를 좌우하는 값)급 모델을 중심으로, 200억개(20B)와 70억개(7B) 모델까지 용도별 라인업을 제시했다. 학습 데이터는 10조 토큰(학습 데이터의 텍스트 분할 단위) 규모라고 밝혔다.
핵심은 효율이다. 회사는 혼합전문가(MoE·여러 ‘전문가’ 중 필요한 것만 켜는 구조)와 MLA(메모리 사용을 줄이는 구조)를 적용해 추론 과정에서 쓰는 KV 캐시(추론 중간값 저장 메모리) 사용량을 약 83% 줄였다고 설명했다. 인프라 비용 부담을 낮춰 기업·기관 도입 문턱을 낮추겠다는 전략이다.
한국어 처리도 강조했다. 토크나이저(텍스트를 토큰으로 나누고 숫자로 바꾸는 규칙) 어휘의 20%를 한국어에 배정하고, 자모(한글 낱자) 조합 방식으로 고어(옛말)까지 처리하도록 설계했다.
NC AI는 배키를 도메인옵스(산업별 AI 운영·배포 체계)와 결합해 산업 현장에 확산시키겠다는 방침이다.
아주경제=한영훈 기자 han@ajunews.com