/AI Chasm Catalyst

출처:이원태 전kisa원장 페이스북 게시글

최근 국내 인공지능 산업에서는 소버린 AI 구축을 위한 거대언어모델 개발이 본격화되고 있다. 이에 따라 LLM의 자립 수준을 체계적으로 분류하고 평가할 수 있는 등급 체계인 T0부터 T6까지의 구분이 업계와 정책 당국의 주목을 받고 있다.

소버린 AI란 무엇인가

소버린 AI는 국가가 자국 내에서 독립적으로 개발하고 운영할 수 있는 인공지능 기술을 뜻한다. 이는 외산 AI 모델에 대한 기술적 의존도를 줄이고, 자국 데이터의 주권 보호와 보안성 강화를 목표로 한다. 특히 국가 차원의 전략적 자산으로 인식되면서, 기술 주권 확보의 핵심 수단으로 떠오르고 있다.

왜 LLM 등급 체계가 필요한가

대형 언어모델은 개발 방식, 구조, 데이터, 인프라 의존도에 따라 그 자립성에 큰 차이를 보인다. 이에 따라 단순한 활용 수준과는 구분되는 기술 내재화 수준을 정량적으로 구분할 필요성이 제기되었고, 그 결과로 T0부터 T6까지의 등급 체계가 마련되었다.

이 체계는 모델의 구조 설계, 학습 데이터 소유권, 학습 인프라, 실행 환경 등 전반적인 요소를 고려하여 판단된다.

LLM 등급 체계의 구체적 구분

LLM 자립도는 T0부터 T6까지 총 7단계로 구분된다.

▶T0는 외부 폐쇄형 API를 단순히 호출하는 방식이다. 모델의 구조와 가중치 모두 외산에 의존하며, 자체 기술 개입이 없다.

▶T1은 폐쇄형 모델을 온프레미스 또는 SaaS 형태로 활용하면서 LoRA나 RAG와 같은 경량 튜닝을 적용한다. 다만 핵심 모델은 여전히 외산이다.

▶T2는 LLAMA나 Qwen처럼 공개된 가중치를 100퍼센트 활용하여 추가 학습을 진행하는 단계다. 모델 구조는 바꾸지 않지만 학습을 통해 성능을 향상시킨다.

▶T3는 오픈소스 기반 모델의 구조나 레이어를 수정하고 전체 재학습을 수행한다. 이 단계에서는 전체 파라미터 중 40~60퍼센트를 자체 생성하게 된다.

▶T4는 구조는 오픈소스와 유사하게 유지하되, 가중치를 처음부터 끝까지 전량 자체적으로 학습하는 방식이다.

▶T5는 모델 구조 자체를 독자적으로 설계하며, 가중치 역시 자체 학습을 수행한다. 구조와 가중치 모두 국산화에 성공한 상태를 의미한다.

▶T6는 T5에 더해 국산 칩셋, 프레임워크, 데이터센터, 학습 데이터 등 모든 구성 요소를 자국산으로 채우는 단계다. 완전한 디지털 주권을 상징하는 단계로 평가된다.

국내 주요 기업들의 LLM 개발 현황

국내 ICT 대기업들도 소버린 AI 구축을 목표로 다양한 LLM 개발을 진행 중이다.

▷KT는 한국어 특화 LLM인 '믿음 2.0'을 공개했다. 해당 모델은 KT가 자체 구축한 데이터셋과 모델링 기술을 바탕으로 개발되었으며, 한국어 표현력과 문화적 맥락을 반영하는 데 중점을 두었다. 이는 자국 언어 특화와 데이터 주권 확보 측면에서 소버린 AI의 요건을 충족한 사례로 평가된다.

▷SK텔레콤은 알리바바의 오픈소스 LLM '큐원 2.5'에 한국어 데이터를 추가 학습시켜 '에이닷엑스 4.0'을 공개했다. 이 모델은 한국어 능력 평가에서 뛰어난 성능을 입증했으며, T2~T3 수준의 기술 자립도에 해당하는 것으로 분석된다.

▷LG그룹은 LG AI연구원을 중심으로 '엑사원(EXAONE)'을 개발하고 있다. 이 모델은 자사 데이터와 인프라를 기반으로 운용되며, 연구소 자체에서 사전 학습을 포함한 전체 파이프라인을 관리하는 방식으로 개발 중이다. 구조의 변형 여부에 따라 T4 이상 등급으로 분류될 가능성이 있다.

기술 전문가의 분석과 기대

국내 AI 전문가들은 이 같은 LLM 등급 체계가 향후 AI 산업의 경쟁력 확보와 정부 지원 정책 설계에 있어 중요한 기준이 될 것이라고 본다. 특히 해당 체계를 통해 기업의 기술 수준을 객관적으로 판단하고, 그에 따른 차등적 투자나 규제 완화를 설계할 수 있다는 점에서 실효성이 크다.

또한 국가 단위에서 디지털 주권 확보를 위해서는 단순히 API 활용 수준을 넘어서야 하며, 핵심 기술의 내재화가 필수적이라는 데 의견이 모아지고 있다.

정책적 연계와 향후 과제

정부는 현재 ‘국가 AI 경쟁력 강화 전략’과 ‘독자 AI 파운데이션모델 개발 지원 사업’을 통해 주요 기업의 자립형 AI 개발을 지원하고 있다. 향후에는 T4 이상 등급을 목표로 한 고도화 정책이 추진될 가능성이 높으며, 연구개발(R&D)뿐 아니라 인프라·인력·데이터 정책도 종합적으로 연계되어야 한다는 지적이 제기된다.

결론

소버린 AI는 단순히 국산 AI 기술의 구현을 넘어서, 국가의 미래 산업 주권을 좌우하는 전략적 요소다. 이에 따라 LLM 등급 체계는 기업의 기술 자립도를 명확하게 구분하고, 자원 배분과 정책 설계의 기준이 될 수 있다.

국내 기업들은 이러한 체계를 바탕으로 전략적 기술 로드맵을 수립하고, 실질적인 기술 자립을 향한 장기 계획을 수립할 필요가 있다.