6년 전, OpenAI가 GPT-2를 공개했을 때만 해도 거대한 언어 모델을 ‘열어놓는’ 선택은 실험에 가까웠다. 그 이후 GPT-3, GPT-4, GPT-4o, 그리고 최근의 GPT-5까지, 대규모 모델들은 점점 폐쇄형 구조로 진화했다. 그 흐름이 2025년 8월, gpt-oss-120b와 gpt-oss-20b의 공개로 크게 꺾였다. 이번 공개는 단순한 신제품 출시가 아니다. ‘오픈 웨이트(open-weight)’라는 선택이 상징하는 바는 AI 기술의 확산 방향과 철학의 변화다.
고성능을 한 장의 GPU에 담다
gpt-oss 시리즈의 가장 눈에 띄는 혁신은 MXFP4 양자화 최적화다. 덕분에 1,170억 파라미터에 달하는 gpt-oss-120b조차 80GB H100 GPU 한 장으로 구동 가능하다. 210억 파라미터의 gpt-oss-20b는 RTX 50 시리즈 16GB VRAM 환경에서도 로컬 실행이 가능하다.
그동안 초대형 모델은 다중 GPU 환경을 전제로 했기에, 단일 장비에서의 구동은 개발·연구 장벽을 크게 낮춘다.
최신 아키텍처의 집약체
두 모델은 모두 Transformer 기반 Mixture-of-Experts(MoE) 구조를 갖추고, Rotary Positional Embeddings, Grouped Multi-Query Attention, 128k 토큰 컨텍스트 등 최신 기법을 총망라했다. 주목할 점은 어텐션 패턴에 슬라이딩 윈도우(128토큰)를 교차 적용해 메모리 효율성을 확보했다는 점이다.
또한 추론 모드를 low·medium·high로 설정할 수 있어, 비용·속도·정확도를 상황에 맞게 조절할 수 있다.
Qwen3·DeepSeek MoE와의 맞대결
중국 알리바바의 Qwen3는 깊이(48 블록)와 다수의 작은 전문가(128명)를 무기로 한다. 반면 gpt-oss는 절반 수준의 블록 수에 더 넓은 임베딩 차원(2,880)과 큰 전문가 구조를 채택했다. 이는 병렬화 효율을 높여 추론 속도를 끌어올린다.
DeepSeek MoE는 극단적으로 세분화된 전문가와 공유 전문가 구조를 통해 특정 분야(수학·코딩)에서 압도적인 성능을 발휘한다. 하지만 다중 GPU와 초고성능 클러스터를 요구해 접근성이 떨어진다. gpt-oss는 성능·하드웨어 요구사항·라이선스 자유도 측면에서 보다 균형 잡힌 선택지다.
성능과 한계
벤치마크에서 gpt-oss-120b는 OpenAI의 폐쇄형 모델 o4-mini와 어깨를 나란히 했고, 일부 reasoning·코딩 테스트에서는 이를 넘어섰다. gpt-oss-20b 역시 o3-mini 수준의 성능을 보였다.
다만 초기 사용자 평가에 따르면, 일반 지식 응답에서 ‘환각(hallucination)’ 비율이 다소 높다는 지적도 있다. 이는 도구 기반 추론을 전제로 한 학습 설계 때문일 가능성이 크다.
전문가가 본 의미
OpenAI 연구원 크리스 코흐는 “gpt-oss-120b는 최신 폐쇄형 모델에 근접한 성능을, 더 개방된 환경에서 구현한 점이 주목할 만하다”고 말했다.
프랑스의 AI 연구자 장 마르크 벨몽은 “MXFP4 최적화로 고성능 모델을 단일 GPU에서 실행할 수 있다는 점은 연구·교육·스타트업 생태계 모두에 중요한 변곡점”이라고 평가했다.
오픈 웨이트 경쟁 구도의 변화
gpt-oss의 출시는 단순히 새로운 모델이 늘었다는 의미를 넘어선다.
Qwen3, DeepSeek, Mistral 등과 함께 글로벌 오픈 웨이트 경쟁이 본격화됐고, 이는 AI 민주화와 기술 주권 논의에 새로운 동력을 제공한다. Apache 2.0 라이선스 채택은 모델 재활용·맞춤형 튜닝·상용 서비스 통합을 모두 가능하게 해, 폐쇄형 모델이 주도하던 AI 시장에 균열을 만들 가능성이 높다.
앞으로의 전망
gpt-oss 직후 발표된 GPT-5가 종합 벤치마크에서 여전히 최고점을 유지했지만, 양자화된 오픈 웨이트 모델이 이 정도 격차까지 좁혔다는 사실은 주목할 만하다.
향후 도구 통합, 멀티모달 확장, 장기 문맥 처리 기술이 결합된다면, gpt-oss는 연구용을 넘어 산업 현장에서도 실질적 대안이 될 수 있다.
AI 기술의 미래는 이제 ‘더 크고 더 폐쇄적인’ 방향만이 아니라, ‘충분히 강력하면서도 개방적인’ 길이 동시에 열리고 있다.