/AI Chasm Catalyst


구글 클라우드는 5월 27일 개발자 피드백을 반영해 Vertex AI Studio를 전면 개편하고, 비디오·이미지·음성·음악까지 한 번에 다루는 멀티모달 생성형 미디어 허브로 재정비했다. 이번 개편으로 프롬프트 설계부터 그라운딩, 튜닝, 코드 생성, 테스트 배포까지 한 화면에서 이어지는 워크플로가 가능해졌다.

◆ 무엇이 달라졌나

새 인터페이스는 첫 화면에서 샘플과 도구에 곧바로 접근하도록 바뀌었고, 대화형과 자유형 프롬πτ을 한 UI로 통합했다. 프롬프트의 생성과 수정, 비교, 저장, 이력 추적이 가능해졌으며 변수·함수 호출·예시 추가 같은 고급 기법도 쉽게 쓸 수 있도록 했다. 여기에 모델 튜닝과 평가, 배치 예측 기능을 곁들여 빠르게 가설을 검증하고 성능을 올리도록 설계했다.

◆ 미디어 모델 포트폴리오 확대

Vertex AI Media Studio에서 Veo(비디오), Imagen(이미지), Chirp(음성), Lyria(음악) 등 구글의 생성형 미디어 모델을 다룰 수 있다. 일부 기능과 모델은 단계적으로 공개되며, Lyria와 Veo의 특정 기능은 사전 신청(allowlist) 기반의 프리뷰로 제공된다. 이로써 기업은 텍스트 프롬프트에서 이미지·영상·음악까지 연속 자산을 제작하는 ‘엔드투엔드’ 미디어 파이프라인을 구축할 수 있다.

◆ 개발자 중심의 ‘빌드’ 경험

Studio 내부에서 최신 Gemini 2.5 계열을 바로 시험해 텍스트 생성, 이미지 제작, 오디오 생성, 멀티모달 입출력, Live API까지 테스트할 수 있다. 샘플 코드는 파이썬·안드로이드·스위프트·웹·플러터·cURL로 제공되고, 파이썬 코드는 Colab Enterprise로 즉시 가져가 실행할 수 있다. 작성한 프롬프트는 몇 번의 클릭으로 테스트용 웹 애플리케이션으로 배포해 빠른 검증이 가능하다.

◆ 신뢰성을 위한 그라운딩

현실 세계의 최신 정보로 답변을 근거화하기 위해 Google Search 그라운딩과 Google Maps 그라운딩을 지원한다. 사내 지식기반이 필요한 경우 Vertex AI RAG Engine 또는 Vertex AI Search를 연결해 도메인 데이터에 근거한 응답을 만들 수 있다. 지도 기반 문맥을 더하는 Maps 그라운딩은 현재 Pre-GA 단계로 지역 제한이 있음을 유의해야 한다.

◆ 접근성과 사용성

플랫폼 전반에 다크 모드가 도입되어 장시간 작업 시 가독성이 개선됐다. 신규 사용자는 300달러 크레딧으로 PoC를 진행할 수 있고, 매월 20개 이상 제품을 무료 한도 내에서 시험해 볼 수 있다.

◆ 업계·학계 진단

클라우드 아키텍트들은 “프롬프트 설계와 평가, 배치 예측이 한 화면에 모이면서 ‘모델 실험→코드화→샌드박스 배포’의 전환 비용이 줄었다”고 분석한다. 학계에서는 “검색·지도·사내 지식과의 결합이 생성형 모델의 환각을 줄이는 핵심이며, 데이터 거버넌스와 저작권 면책 같은 제도가 병행되어야 대규모 현장 도입이 가능하다”는 평가가 나온다. 실제로 구글은 미디어 생성 모델에 디지털 워터마킹과 안전 필터를 내장하고, 저작권 면책 조항을 확대해 상용 리스크를 낮추는 방향을 병행하고 있다.


◆ 실제 활용 사례

글로벌 브랜드들은 마케팅 크리에이티브 제작 시간을 단축하고 있으며, 비디오 편집·카메라 프리셋·중간 프레임 보간 같은 기능으로 에셋 재가공을 자동화하고 있다. L’Oréal과 Kraft Heinz 등은 이미지·영상 생성 파이프라인을 표준화해 국가·언어별 캠페인을 빠르게 확장하고, 내부 브랜드 지식을 결합해 제작과 검증 속도를 끌어올린 사례를 소개했다.

◆ 체크포인트와 한계

일부 미디어·오디오 기능은 프리뷰 또는 허용 리스트 기반으로 제한될 수 있다. 또 Google Maps 그라운딩은 현재 사전 공개 단계로 유럽경제지역에서는 사용할 수 없다. 멀티모달 모델을 대규모로 사용할 경우, 토큰·미디어 길이·API 호출 제한 등 비용·지연 요소를 모니터링해야 한다.