/AI Chasm Catalyst
GPT-5의 등장에도 불구하고 대형언어모델의 발전은 한계에 다다랐다. 챗봇 시대는 저물고, 이제는 스스로 판단하고 행동하는 ‘AI 에이전트’의 시대가 열린다. 아마존으로 이직한 데이비드 루안은 “AI의 미래는 챗봇이 아닌 에이전트”라며, 기술의 방향 전환을 강력히 시사했다.
◆ GPT-5, 기술적 진화인가 한계의 신호인가
아마존 AGI SF 랩을 이끄는 데이비드 루안 부사장이 최근 인터뷰에서 GPT-5의 출시가 대형언어모델(LLM)의 성능 한계를 드러낸 사례라고 평가했다. 그는 AI가 단순한 언어모델을 넘어 ‘에이전트’로 진화해야 한다고 주장하며, 현재의 기술적 정체 상태를 지적했다.
◆ 반복되는 모델 개선, 혁신은 실종
루안 부사장은 현재 AI 업계가 높은 성숙도에 도달했지만, 이는 혁신의 정체를 의미한다고 분석했다. GPT-5를 포함한 최신 프런티어 모델들이 성능 면에서 수렴하고 있으며, 새로운 도약보다는 기존 기능의 반복적 개선이 이루어지고 있다는 것이다.
◆ 플라톤의 동굴과 LLM의 한계
그는 플라톤의 동굴 우화를 인용해 LLM의 구조적 한계를 설명했다. 인간이 동굴 벽에 비친 그림자를 현실로 인식하듯, LLM 역시 훈련 데이터의 단면만을 반영할 뿐, 진정한 현실 인식이나 인과 관계 이해에는 도달하지 못한다는 것이다.
◆ AGI의 정의, 시대에 따라 변화해야
루안은 2018년 오픈AI가 제시한 AGI 정의—경제적 가치 있는 작업에서 인간을 능가하는 시스템—이 이제는 현실적인 목표가 되었으며, 앞으로는 인간이 원하는 모든 작업을 수행할 수 있는 시스템으로 정의가 바뀌어야 한다고 주장했다.
◆ 에이전트의 조건: 인과적 사고와 안정성
현재 등장한 AI 시스템들은 여전히 LLM의 범주에 머물러 있으며, 진정한 에이전트로 보기 어렵다는 것이 루안의 진단이다. 그는 에이전트가 되기 위해서는 인과 관계를 이해하고, 안정적으로 의사결정을 내릴 수 있어야 한다고 강조했다. 아마존은 이를 위해 ‘노멀코어 에이전트’ 전략을 채택하고 있으며, 이는 고성능보다는 99% 이상 작동하는 안정적인 워크플로우를 지향한다.
◆ GPT-5의 실제 성능과 개발 사례
최근 GPT-5는 MacOS 기반 음성 인식 애플리케이션 개발에 활용되며, 고급 기능 구현에 성공했다는 평가를 받았다. 하지만 사용자 친화성, 정확도, 모델 통합 등에서 여전히 개선이 필요한 과제가 남아 있다 A. 이는 GPT-5가 뛰어난 기능을 갖췄지만, 여전히 인간의 직관과 판단을 완전히 대체하기는 어렵다는 점을 보여준다.
◆ 인재의 희소성과 AI의 미래
루안은 프런티어 모델을 설계하고 개념화할 수 있는 인재가 전 세계적으로 150명도 되지 않는다고 밝혔다. 그는 물리학, 퀀트 투자 등 타 분야 출신의 인재들이 AI에 빠르게 적응하며 큰 변화를 이끌 수 있다고 전망했다. 단, 이들이 AI 베테랑과 협업할 때만 진정한 성과가 가능하다고 덧붙였다.
◆ 챗봇을 넘어선 새로운 폼 팩터의 등장 예고
마지막으로 그는 향후 5년 내에 지금은 상상하지 못한 6~7개의 핵심 제품 폼 팩터가 등장할 것이라며, AI 업계가 챗봇과 코딩에만 집중해서는 안 된다고 경고했다. 진정한 성공을 원한다면, 새로운 형태의 제품과 사용자 경험에 주목해야 한다는 조언이다.