/AI Chasm Catalyst
구글 클라우드 AI 리서치팀이 인공지능을 활용한 새로운 연구 도구 ’Test-Time Diffusion Deep Researcher(TTD-DR)’를 개발했다고 21일 발표했다.
이 새로운 프레임워크는 기존 연구 AI 시스템들과 차별화된 접근법을 통해 OpenAI의 딥 리서치를 포함한 기존 도구들을 성능상 앞서는 것으로 나타났다.
인간 연구 과정을 모방한 혁신적 설계
TTD-DR은 연구 보고서 생성을 확산(diffusion) 과정으로 개념화한 새로운 프레임워크다. 시스템은 예비 초안을 작성한 후, 이를 진화하는 기반으로 삼아 연구 방향을 안내하는 업데이트 가능한 골격 구조로 활용한다.
이후 초안은 ‘디노이징’ 과정을 통해 반복적으로 개선된다는 것이 핵심 특징이다.
연구팀은 이 시스템이 인간 연구자들의 작업 방식을 모방했다고 설명했다. 실제 연구자들이 검색, 추론, 수정의 반복 과정을 거치는 것처럼, TTD-DR도 검색 계획 수립, 검색 실행, 결과 검토 및 계획 재평가, 추가 검색, 중간 보고서 수정을 거쳐 최종 결과를 도출한다.
기존 모델 재훈련 없이 성능 향상
TTD-DR의 특징 중 하나는 백본 모델의 새로운 훈련 없이도 높은 성능을 달성했다는 점이다. 시스템은 확산 모델을 기반으로 하되, 에이전트 플로우 방식을 통해 작동한다.
이는 최근 AI 업계에서 주목받고 있는 ‘훈련보다는 추론 시점 계산 능력 향상’이라는 트렌드와 일치한다.
연구진은 논문에서 “이 접근법은 검색과 다중 단계 추론이 필요한 광범위한 벤치마크에서 기존 딥 리서치 에이전트들을 크게 앞서는 최첨단 결과를 달성했다”고 밝혔다.
OpenAI보다 우수한 성능 입증
TTD-DR은 모든 벤치마크에서 일관되게 우수한 결과를 달성했다. OpenAI 딥 리서치와의 직접 비교에서 두 가지 장문 연구 보고서 생성 작업에서 각각 69.1%와 74.5%의 승률을 기록했다고 연구팀은 발표했다.
이는 OpenAI가 최근 공개한 딥 리서치 기능과의 경쟁에서 구글이 한 발 앞서 나갔음을 시사한다.
OpenAI의 딥 리서치는 o3 추론 모델의 변형을 기반으로 하며, 최대 30분간 사고할 수 있는 능력을 갖춘 것으로 알려져 있다.
에이전트 방식 vs 훈련 방식의 경쟁
현재 AI 업계에서는 모든 문제를 대규모 훈련으로 해결할 것인지, 아니면 에이전트 기술의 연속으로 해결할 것인지에 대한 논쟁이 계속되고 있다. OpenAI와 구글 모두 최근 에이전트 방식에 무게를 두고 있는 상황이다.
TTD-DR의 등장은 이러한 트렌드를 더욱 강화하는 사례로 평가된다. 시스템은 확산 모델이 GPU 효율성 측면에서 장점을 가진다는 점도 고려할 때, 향후 연구 AI 도구의 발전 방향을 제시할 것으로 전망된다.
실용성과 접근성
흥미롭게도 구글은 이번 연구와 동시에 Gemini 서비스에서 참조 문헌을 보여줄 때 관련 부분을 이미지로 표시하는 기능도 개선한 것으로 확인됐다. 이는 연구 도구의 사용자 경험 개선에도 신경을 쓰고 있음을 보여준다.
AI 연구 도구 시장에서 구글과 OpenAI 간의 경쟁이 더욱 치열해질 것으로 예상되는 가운데, TTD-DR의 성과는 향후 AI 기반 연구 도구의 발전에 새로운 이정표가 될 것으로 평가된다.
*이 기사는 구글 클라우드 AI 리서치팀의 공식 논문과 관련 자료를 바탕으로 작성되었습니다.*