/AI Chasm Catalyst

NC AI는 2025년 7월 30일, 초경량 멀티모달 AI 모델 ‘VARCO VISION 2.0 1.7B’를 오픈소스로 공개했다고 밝혔다.

17억 매개변수(1.7B)로 설계된 이 모델은 경량 구조에도 불구하고 글로벌 톱티어 멀티모달 AI와 대등하거나 우수한 성능을 자랑하며, 온디바이스 환경에 최적화된 점이 특징이다.

◆온디바이스 최적화로 실질적 활용성 강화

VARCO VISION 2.0 1.7B는 스마트폰, PC 등 개인 기기에서 원활히 작동하도록 설계돼 네트워크 연결이나 서버 의존 없이 고성능 비전-언어 처리가 가능하다.

이를 통해 금융, 교육, 제조 등 다양한 산업에서 문서 자동화, 콘텐츠 제작, 영상 검색 등 디지털 전환 솔루션으로 활용될 전망이다.

◆이미지·텍스트 동시 처리 및 복잡 데이터 분석

이 모델은 이미지와 텍스트를 동시에 이해하며, 다수의 이미지, 문서, 표, 차트를 효과적으로 분석한다. 특히 광학문자판독(OCR) 특화 모델(1.7B OCR)은 한글·영문 혼합 환경에서도 높은 정확도를 보장한다.

문서 자동화, 차트 해석 등 실무 중심의 복잡한 데이터 처리에 강점을 보인다.

◆글로벌·국내 벤치마크서 우수한 성능 입증

VARCO VISION 2.0 1.7B는 주요 벤치마크에서 경쟁 모델들을 압도했다:

• 텍스트 및 한국어 성능: K-시드, K-LLaVABench에서 InternVL3 2B, Ovis2 2B 등을 능가하며 동급 최고 수준의 한국어 처리 능력을 입증.

• 대학 지식·과학 차트 해석: MMMU, AI2D 벤치마크에서 카카오 카나나 3B, 네이버 하이퍼클로바 3B와 대등하거나 우수한 성능.

• 수학적 추론·시각언어 평가: MathVista, MM-Vet에서 2위를 기록하며 고차원 추론과 시각언어 기능에서 탁월함을 보였다.

전문가들은 “모델 크기 대비 뛰어난 성능과 한글·한국 환경 최적화, 글로벌 벤치마크에서의 경쟁력이 돋보인다”고 평가했다.

◆4종 오픈소스 모델 공개, 국내외 호응

NC AI는 14B, 1.7B, 1.7B OCR, 임베딩 등 4종 모델을 공개했다. 7월 16일 공개된 14B 모델은 열흘 만에 약 1만 건 다운로드를 기록했으며, 1.7B 모델도 공개 첫날부터 국내외 개발자와 연구자들의 큰 관심을 받았다.

오픈소스 라이선스는 CC-BY-NC-4.0으로, 연구 목적에 자유롭게 활용 가능하다.

◆현장 활용 사례 확대

금융권에서는 장표 자동화와 대규모 문서 처리 솔루션 도입이 진행 중이며, 대학 및 공공기관에서는 차트 해석, 교육 자동화 등 실증 프로젝트가 추진되고 있다.

이연수 NC AI 대표는 “경량 고성능 모델로 국내 산업 경쟁력을 높이고, 더 많은 사람이 쉽게 활용할 수 있는 AI 개발을 지속하겠다”고 밝혔다.