원문: https://arxiv.org/pdf/2507.22358

서론: 자율 에이전트의 한계와 새로운 대안의 필요성

대형 언어 모델(LLM)을 기반으로 한 AI 에이전트의 기술은 눈부시게 발전하며, 웹 브라우징, 코드 작성, 데이터 분석 등 복잡한 작업을 자동화하는 능력을 갖추고 있습니다. 몇 개의 API 호출만으로 복잡한 업무를 처리할 수 있는 이러한 자율 에이전트는 생산성 혁신의 핵심 동력으로 주목받고 있습니다.

하지만 현실은 이상과 다릅니다. AI 에이전트는 여전히 인간의 직관, 상황 판단력, 유연성에 미치지 못하는 한계를 보입니다. 사용자의 의도를 오해하거나, 예기치 않은 변수에 대처하지 못하거나, 보안 취약점을 노출하는 등의 ‘비정렬(misalignment)’ 문제가 끊임없이 보고되고 있습니다. 또한, 외부 세계와 직접 상호작용하는 만큼 보안 위협과 악의적 조작의 표적이 되기도 쉽습니다.

이러한 배경에서 Microsoft Research는 기존의 ‘완전 자동화’ 방식의 한계를 지적하고, 인간의 개입과 AI의 능력을 결합한 ‘인간-에이전트 협업 시스템(Human-in-the-loop Agentic Systems)’이 더 나은 대안이 될 수 있다고 주장합니다. 이 철학을 바탕으로 탄생한 것이 바로 ‘Magentic-UI’입니다. 이는 단순한 인터페이스를 넘어, 인간과 AI가 서로의 약점을 보완하며 협력할 수 있는 새로운 패러다임을 제시하는 실험적 플랫폼입니다.

Magentic-UI의 철학: 인간과 AI, 각자의 강점을 결합하다

Magentic-UI는 다음과 같은 핵심 가정을 기반으로 설계되었습니다.

AI는 빠르지만 완벽하지 않다. AI는 초고속으로 데이터를 처리하고 반복 작업을 수행하는 데 뛰어나지만, 예측 불가능한 상황에서 실수할 수 있습니다.

인간은 직관과 맥락 이해력이 뛰어나지만 반복 작업에 비효율적이다. 인간은 복잡한 맥락을 파악하고 직관적인 판단을 내리지만, 반복적인 업무에는 시간과 에너지가 많이 소요됩니다.

이 둘을 결합하면 서로의 약점을 보완할 수 있다. AI의 속도와 정확성에 인간의 직관과 판단력이 더해져, 더 안정적이고 효율적인 시스템을 구축할 수 있습니다.

이러한 철학을 실현하기 위해 Magentic-UI는 인간을 단순한 감시자가 아닌, AI와 동등한 파트너로서의 역할을 부여합니다. 인간은 공동 기획자(Co-Planner), 공동 작업자(Co-Tasker), 그리고 최종 검증자(Verifier)로서 시스템에 능동적으로 참여합니다.

시스템 구성 요소: 인간과 AI의 협업을 위한 구체적 메커니즘

Magentic-UI는 다중 에이전트 구조를 기반으로 웹 브라우징, 코드 실행, 파일 조작 등을 지원하며, Model Context Protocol(MCP)을 통해 외부 도구를 유연하게 연결합니다. 이를 통해 다양한 디지털 작업에 확장성 있게 대응할 수 있습니다. 주요 구성 요소는 다음과 같습니다.

1. 공동 계획 수립 (Co-Planning): 명확한 목표를 위한 첫걸음

사용자가 작업을 요청하면, 시스템의 중앙 에이전트인 'Orchestrator’가 초기 계획을 자연어 기반의 단계적 시나리오로 생성합니다. 이 계획은 사용자에게 직접 보여지며, 사용자는 이를 수정하거나 승인할 수 있습니다.

사례: 사용자가 "Surface 충전기를 구매해줘"라고 요청하면, Orchestrator는 "아마존에서 'Surface 충전기’를 검색하고, 리뷰가 좋은 상품을 필터링한 뒤 장바구니에 담는다"는 계획을 제시할 수 있습니다. 이때 사용자가 "아니, 공식 Microsoft 스토어에서만 구매해야 해"라고 정보를 보태주면, 계획은 즉시 수정됩니다.

전문가 분석 (AI 윤리 및 설계 전문가 인터뷰): "이 ‘공동 계획’ 단계는 AI 시스템의 가장 큰 강점 중 하나입니다"라고 AI 윤리 연구자인 김민준 교수는 말합니다. “AI가 만들어낸 계획을 인간이 검토하고 수정하는 과정은 AI의 편향이나 오해를 사전에 바로잡을 수 있는 중요한 안전장치입니다. 이를 통해 시스템은 사용자의 숨겨진 의도나 도메인 지식을 학습하고, 결과물에 대한 사용자의 신뢰도를 높일 수 있습니다.”

2. 공동 작업 수행 (Co-Tasking): 유연한 문제 해결 능력

작업이 진행되면서 예상치 못한 상황이 발생할 수 있습니다. 예를 들어, CAPTCHA가 나타나거나, 웹페이지 구조가 변경되거나, 상품 가격이 변동되는 등의 문제가 발생할 수 있습니다. Magentic-UI는 이런 상황에 대해 다음 세 가지 방식으로 인간과 AI가 유연하게 협업할 수 있도록 지원합니다.

인간의 직접 조작: 사용자가 에이전트의 작업을 중단하고 직접 버튼을 클릭하거나 텍스트를 입력하여 문제를 해결합니다.

AI의 질문을 통한 협업: AI가 "이 항목이 품절되었습니다. 대체 상품을 선택할까요?"와 같이 구체적인 질문을 통해 사용자의 의사를 확인하고 다음 단계를 진행합니다.

사용자의 수정 요청: 작업 결과를 확인한 사용자가 "여기서 좀 더 저렴한 제품으로 바꿔줘"와 같이 수정 지시를 내립니다.

이러한 협업 방식은 AI의 한계를 인간이 보완하고, 인간의 반복적인 노동을 AI가 대신하며 시너지를 창출합니다.

3. 행동 가드(Action Guard): 신뢰와 안전을 위한 최후의 보루

안정적인 협업을 위해 Magentic-UI는 모든 AI 행동을 '되돌릴 수 있는가(Reversible)'와 '위험한가(Dangerous)'라는 기준으로 분류하고 통제합니다.

항상 승인이 필요한 행동: 이메일 발송, 결제 요청, 파일 업로드 등 잘못 실행했을 경우 심각한 결과를 초래할 수 있는 민감한 작업은 반드시 사용자의 최종 승인을 거칩니다.

자동 또는 조건부 승인이 가능한 행동: 단순한 링크 클릭, 페이지 스크롤, 텍스트 입력 등은 시스템이 자동으로 수행하거나, 특정 조건 하에 승인합니다.

심지어 ‘아마도 되돌릴 수 없는(maybe irreversible)’ 행동에 대해서는 LLM 기반의 'ActionGuard’가 행동의 의미를 분석하여 잠재적 위험을 평가하고 사용자에게 경고합니다. 이 구조는 AI의 오작동으로 인한 피해를 최소화하고 사용자의 프라이버시를 보호하는 데 핵심적인 역할을 합니다.

4. 메모리(Memory): 경험의 축적과 지능화된 재활용

Magentic-UI는 사용자가 완료한 작업을 ‘계획’ 단위로 기억합니다. 이 기억은 단순한 기록이 아니라, 향후 유사한 작업을 수행할 때 재사용 가능한 실행 템플릿 역할을 합니다.

사례: "출근 셔틀 예약"이나 "arXiv 논문 요약 정리"와 같이 반복성이 높은 작업은 처음 완성된 계획이 저장됩니다. 다음에 유사한 요청이 오면, 시스템은 벡터 기반 검색과 LLM 필터링을 통해 저장된 계획을 찾아내어 자동으로 추천하거나 실행을 시작합니다.

전문가 분석 (인간-컴퓨터 상호작용 전문가 인터뷰): "메모리 기능은 인간-에이전트 협업 시스템이 진정으로 '지능적’으로 발전하는 데 중요한 요소"라고 인간-컴퓨터 상호작용(HCI) 전문가 이서영 박사는 설명합니다. “인간처럼 경험을 학습하고 축적하는 능력은 시스템의 사용 편의성을 높이고, 사용자 개인의 작업 스타일을 학습하여 점점 더 맞춤형 서비스를 제공할 수 있는 기반이 됩니다.”

성능 평가: 적은 개입으로 큰 효과, 현실적 검증

Magentic-UI의 효과는 다양한 실험을 통해 검증되었습니다.

벤치마크 평가: GAIA, WebVoyager, AssistantBench, WebGames 등 4개 주요 벤치마크에서 테스트를 진행했습니다. WebVoyager에서는 82.2%라는 최고 수준(SOTA)의 성능을 보였으며, 복합적인 추론이 필요한 GAIA에서는 42.5%의 성적을 기록했습니다. 이는 단독 에이전트에 비하다 성능이 낮을 수 있으나, 인간의 개입을 통해 이 한계를 효과적으로 보완할 수 있음을 보여줍니다.

시뮬레이션 사용자 실험: 인간의 개입이 시스템 성능에 미치는 영향을 분석한 결과, 인간이 개입한 시나리오에서 작업 성공률이 30.3%에서 51.9%로 무려 21.6%p나 향상되었습니다. 특히, 사용자에게 도움을 요청한 비율은 전체 작업의 10%에 불과했음이 중요합니다. 이는 '적절한 타이밍의 최소한의 개입’으로도 큰 성과를 낼 수 있음을 시사합니다.

사용자 정성 평가: 12명의 실제 사용자를 대상으로 한 설문조사에서 시스템의 전반적인 만족도(SUS 점수)는 74.58점으로 긍정적인 평가를 받았습니다. 사용자들은 실시간 개입의 용이성, 시각적 피드백, 민감한 작업에 대한 승인 체계 등을 높이 평가했습니다. 반면, 계획 구조의 단순화나 CAPTCHA 처리 방법 개선 등 구체적인 개선점도 함께 제기되었습니다.

보안성: 격리 환경과 다층 방어 체계

신뢰할 수 있는 협업 시스템을 위해서는 강력한 보안이 필수적입니다. Magentic-UI는 Docker 기반의 완전 격리된 샌드박스 환경을 사용하여 웹 브라우징, 코드 실행, 파일 조작 등 모든 작업을 안전하게 격리합니다.

이러한 보안 체계는 OAuth 사기, 프롬프트 인젝션, 파일 탈취 등 24가지의 다양한 공격 시나리오에 대해 기본 설정에서는 모두 성공적으로 방어했습니다. 다만, 일부 방어 기능을 의도적으로 비활성화했을 때 프롬프트 인젝션 공격이 성공한 사례가 있어, 보안 메커니즘의 중요성을 다시 한번 확인했습니다.

결론: 미래의 협업형 AI를 위한 첫걸음

Magentic-UI는 단순한 사용자 인터페이스를 넘어, 인간과 AI가 어떻게 협력하며 더 나은 결과를 만들어낼 수 있는지 탐구하는 중요한 연구 플랫폼입니다. 이 시스템은 '완전한 자율’이 아닌 '통제된 협업’이라는 새로운 패러다임을 제시하며, AI의 속도와 인간의 지혜가 결합될 때 생산성과 신뢰성을 동시에 확보할 수 있음을 보여줍니다.

정확성과 신뢰성이 요구되는 공공·산업 분야에서 Magentic-UI는 신뢰 가능한 협업형 AI 시스템을 구현하기 위한 기반이 될 수 있을 것입니다. 또한, 오픈소스로 공개되어 연구자와 개발자들이 자유롭게 활용하고 개선할 수 있는 기반이 마련됨으로써, 더 안전하고 유용한 인간-에이전트 협업 시스템의 미래를 향한 중요한 첫걸음을 내디뎠다고 평가할 수 있습니다.