GPT-5 출시 “울퉁불퉁”… Altman, Reddit AMA에서 해법 제시

/AI Chasm Catalyst

OpenAI가 2025년 8월 7일 공개한 최신 언어 모델 GPT‑5는, 출시 직후 일부 사용자들 사이에서 성능 부진과 불편함에 대한 반응을 불러일으켰습니다.

이러한 상황에 대해 CEO 샘 올트먼은 “롤아웃이 다소 울퉁불퉁했다(bumpy)”며 Reddit AMA(Ask‑Me‑Anything)에서 해명과 대응 방안을 밝혔습니다 .

라우터 오류로 ‘덜 똑똑하게’ 작동한 GPT-5

GPT‑5의 핵심 기능 중 하나는 실시간 라우터입니다. 이 시스템은 사용자의 입력 유형에 따라 빠른 응답용 또는 깊이 있는 추론용 모델을 자동으로 판단해 연결합니다.

하지만 출시 첫날에는 이 자동 전환 기능이 제대로 작동하지 않았고, 이로 인해 사용자들은 GPT‑5가 이전 GPT‑4o보다 저조한 성능을 보이는 듯 느꼈습니다. 올트먼은 이를 “autoswitcher가 일정 시간 동안 작동하지 않았기 때문”이라고 설명했습니다 .

그는 또한 “의사결정 경계(decision boundary)” 조정을 통해 올바른 모델로 연결될 가능성을 높이고, 어느 모델이 응답했는지 투명하게 공개할 계획임을 밝혔습니다 .

GPT-4o, Plus 가입자에게 복귀

GPT‑4o의 부드럽고 친숙한 응답 스타일에 익숙해져 있다는 반응이 많았습니다. 이에 대해 올트먼은 Plus 요금제 가입자에게 GPT‑4o 선택권을 일정 기간 복원하는 방안을 검토 중이라고 밝혔습니다.

이를 통해 특정 용도에서 GPT‑4o가 더 유용했던 일부 사용자들의 불만을 완화하고자 하는 의도로 보입니다 .

“차트 범죄(chart crime)” 해프닝… Altman은 “메가 실수” 사과

출시 현장에서 발표된 일부 시각 자료에서 수치와 시각적 표현이 일치하지 않는 오류, 즉 “차트 범죄” 현상이 발생했습니다. 예를 들어 GPT‑5의 사기(deception) 평가율은 약 16.5%였지만, 시각적으로는 50%로 오인할 정도로 크게 표현되었습니다 .

올트먼은 이를 “mega chart screwup”라고 표현하며 자신의 SNS에서 사과했으며, 이후 공식 블로그에는 수정된 차트를 게시했다고 합니다 .

전문가 평가 및 사용자 반응: 성능과 경험의 간극

기술 언론과 전문가들은 GPT‑5의 코딩 능력, 정답률, 환각(hallucination) 감소 등 여러 측면에서 향상된 성능을 인정하고 있습니다 .

그러나 사용자들 사이에서는 “기능 향상보다 이전 모델의 성격이 더 그립다”는 정서도 강하게 존재합니다. 특히, Reddit 등을 통해 “GPT‑5가 끔찍하다”는 반응과 함께 기존 버전의 선택권을 유지하라는 요구가 이어지고 있습니다 .

사용자 맞춤성 강조: “하나의 모델로는 부족” 강조

올트먼은 이번 사건을 계기로 “모두에게 맞는 단일 모델은 없다”고 인정하며, 향후 사용자 맞춤형 응답을 위한 ‘개성(steerability)’ 연구를 강화하겠다고 밝혔습니다 .

또한 Plus 사용자에겐 한시적으로 이용량(rate limits)을 두 배로 늘려 사용 환경 안정성을 높이겠다는 약속도 전했습니다 .

마무리: 신뢰 회복을 향한 첫 걸음

샘 올트먼은 AMA를 통해 “보다 안정된 시스템이 되도록 지속적으로 노력하겠다”고 마무리했습니다. GPT-5는 현시점에서 성능은 향상된 모델이지만, 사용자의 기대 수준과 경험의 간극을 좁히는 것이 향후 과제임이 드러났습니다.

정보관리기술사, IBM AI Engineering Professional Certificate, ISO 42001 Master

메이커스저널 이길환 편집장 happytalkman@weai.kr

이길환 편집장의 기사 더보기

전체 메뉴