/AI Chasm Catalyst
오픈AI가 발표한 최신 연구에 따르면, 기존 단일 검색 방식의 한계를 극복하는 멀티스텝 검색 기술이 인공지능 성능을 획기적으로 개선할 수 있는 것으로 나타났다.
◆ 기존 검색 방식의 한계와 새로운 대안
전통적인 정보 검색 시스템은 한 번의 쿼리로 직접적인 답변만을 제공하는 단일 홉 방식을 사용해왔다. 하지만 이런 방식은 지식 그래프 전체에 분산된 중요한 사실들을 놓치는 경우가 많았다. 복잡한 질문에 대해 포괄적이고 정교한 답변을 제공하기 어려웠던 것이다.
멀티스텝 검색은 지식 그래프를 여러 단계에 걸쳐 반복적으로 탐색하는 방식이다. 관계를 따라 이동하며 여러 홉에 걸쳐 증거를 수집하고 종합한다. 이를 통해 단일 검색으로는 발견할 수 없었던 복잡한 종속성과 잠재된 연결고리들을 찾아낸다.
◆ 시간 인식 지식 그래프의 중요성
멀티스텝 검색의 핵심은 시간 인식 지식 그래프다. 기존 지식 그래프가 사실을 정적으로 취급했다면, 새로운 시스템은 정보의 시간적 변화를 추적한다. 특정 날짜에 무엇이 사실이었는지, 언제부터 언제까지 유효했는지를 정확히 기록한다.
금융 서비스 분야에서 예를 들면, "2023년 2월 이후 무디스의 특정 은행에 대한 장기 등급 변화"를 추적할 수 있다. 제조업에서는 "2022년 5월부터 2023년 3월 사이 출하된 특정 모델 차량에 탑재된 ECU 펌웨어 버전"을 정확히 파악할 수 있다.
◆ 시스템 구성과 작동 원리
멀티스텝 검색 시스템은 크게 세 가지 핵심 구성 요소로 이뤄진다.
계획 수립기는 사용자의 복잡한 질문을 구체적이고 순차적인 하위 작업들로 분해한다. GPT-4.1과 같은 강력한 추론 모델을 활용해 "회사 A의 2018년부터 2020년까지 연구개발 활동 정보 추출" 같은 실행 가능한 작업으로 나눈다.
오케스트레이터는 계획을 실행하는 역할을 담당한다. 지식 그래프에 대한 일련의 도구 호출을 조정하며, 사실 확인 도구와 추세 분석 도구 등을 활용한다.
검색 반복 과정에서는 각 도구 호출 결과를 평가하고 추가 쿼리가 필요한지 판단한다. 모든 관련 증거가 수집될 때까지 계획과 검색을 반복한다.
◆ 성능 개선 효과
멀티스텝 검색 방식은 여러 면에서 성능을 개선한다. 지식 그래프의 여러 관계와 홉에 걸쳐 증거를 집계함으로써 단일 홉 검색이 놓치는 종속성을 포착한다. 여러 출처의 정보가 필요한 복잡한 질문에 대한 추론을 지원한다.
초기 검색에서 원하는 정보를 찾지 못해도 대안 경로나 출처로 전환해 누락된 데이터를 우아하게 처리한다. 연구 사례에 따르면, 시스템이 경쟁업체의 연구개발 활동에 대한 초기 쿼리에서 정보를 찾지 못했을 때 전략 콘텐츠라는 대안 출처로 성공적으로 전환해 완전한 답변을 제공했다.
◆ 모델 선택과 최적화 방안
멀티스텝 검색에는 여러 그래프 홉에 걸친 추론 능력이 필요하기 때문에 o3, o4-mini 같은 강력한 추론 모델이 권장된다. 프로토타입 단계에서는 GPT-4.1로 정확성을 극대화하고, 안정화 후에는 GPT-4.1-mini나 GPT-4.1-nano로 전환해 비용 효율성을 높일 수 있다.
생산 환경에서는 강화 학습으로 미세 조정된 모델이나 최적화된 모델을 사용할 수 있다. 전체적인 개발 워크플로우는 대형 모델로 시작해 점진적으로 최적화하는 방향으로 진행하는 것이 효과적이다.
◆실제 구현과 적용 분야
이 기술은 이미 실제 환경에서 테스트되고 있다. 기업 실적 발표 자료 188개를 분석한 데이터셋을 활용한 연구에서, 시간에 따른 정보 변화를 정확히 추적하고 복잡한 질문에 종합적인 답변을 제공하는 것으로 확인됐다.
금융, 제조업, 자동차, 제약, 법률, 소비재 등 다양한 산업에서 활용 가능하다. 특히 시간에 민감한 정보가 중요하고 복잡한 관계 분석이 필요한 분야에서 큰 효과를 기대할 수 있다.
이번 연구 결과는 단순한 정보 검색을 넘어 복잡한 추론이 가능한 AI 시스템 개발의 새로운 이정표가 될 것으로 전망된다.
[출처: OpenAI 쿠키북](https://cookbook.openai.com/examples/partners/temporal_agents_with_knowledge_graphs/temporal_agents_with_knowledge_graphs)