2025년 5월 21일, 테슬라가 공개한 휴머노이드 로봇 옵티머스의 최신 시연 영상은 로봇 기술의 진화를 실감하게 만든다. 로봇이 단순한 반복 작업을 넘어, 인간처럼 '보고', '이해하고', '따라 하는' 능력을 갖추기 시작한 것이다.

출처: 테슬라


이번 영상에서 옵티머스는 냄비를 저어 음식을 만들고, 청소기와 브러시를 사용해 바닥과 테이블을 정리하며, 쓰레기를 버리고 캐비닛을 여닫는 일까지 수행했다. 심지어 키친타월을 뜯는 동작까지 자연스럽게 처리했다. 중요한 점은 이 모든 행동이 프로그래밍된 스크립트에 따라 수행된 것이 아니라, 인간의 시연 영상을 보고 스스로 학습한 결과라는 점이다.

옵티머스는 인간이 작업을 수행하는 영상을 1인칭 시점으로 변환하여 학습하며, 원격 조작 데이터만 사용할 때보다 훨씬 빠르게 새로운 작업을 익힌다. 테슬라 옵티머스 부사장 밀란 코박(Milan Kovac)은 이를 "완전히 새로운 작업을 부트스트랩할 수 있는 돌파구"라고 표현했다.

이번 옵티머스의 시연 영상은 단일 신경망 기반으로 작동하며, 복잡한 객체 인식과 연속 동작 수행을 하나의 구조로 처리한다. 이는 기존 로봇들이 각 작업마다 별도의 명령어를 요구했던 방식과 달리, 옵티머스는 한 번의 시연만으로 전체 맥락을 이해하고 동작을 재현할 수 있는 것이다.

출처: 테슬라


테슬라의 비전은 이보다 더 넓다. 향후 옵티머스는 유튜브나 SNS처럼 무작위 인터넷 영상, 심지어 제3자 시점의 영상에서도 학습할 수 있도록 확장될 계획이다.

나아가 음성이나 텍스트 명령을 통한 자연어 입력도 수용하게 되면, 로봇이 하나의 명령어로 수많은 작업을 멀티태스킹하는 것이 가능해진다.

이러한 접근은 단순한 가능성 향상을 넘어, 로봇의 학습 방식 자체를 변화시키는 전환점으로 평가된다. 옵티머스는 혀재 쓰레기 버리기, 바닥 청소 같은 작업은 물론, Model X 차량 부품을 조작하는 수준의 정밀 작업도 동일한 신경망 구조로 수행하고 있다.

출처: 테슬라


엘론 머스크는 자신의 X(구 트위터) 계정을 통해 이 영상을 공유하며, 옵티머스를 "역대 최대의 제품"이라 표현했다. 그는 이 로봇이 사람들의 시간을 절약해주고, 일상 속 '필요하지만 하기 귀찮은' 반복적인 집안일을 대신하게 될 것이라 강조했다.

현재 이 시연 영상은 유튜브, 레딧, 기술 커뮤니티를 통해 수백만 뷰 이상을 기록하고 있으며, 테슬라가 구상하는 차세대 로봇 비전과 AI 접목 기술에 대한 관심이 빠르게 확산되고 있다.

로봇이 유튜브를 보며 배우는 시대. 옵티머스는 이제 더 이상 '공장 안의 기계'가 아니라, 인간처럼 보고 배우는 존재로 진화 중이다. AI와 로보틱스의 경계가 무너지는 순간, 테슬라의 실험은 SF가 아닌 현실이 되어가고 있다.

임지윤 기자(dlagyoun@naver.com)