구글이 Google I/O 2026에서 발표했던 Gemini Omni와 Gemini 3.5 Flash를 실제로 돌린 데모 9개를 공개했어. 발표 때는 “이런 게 된다”는 설명이었다면, 이번엔 동작 영상으로 보여주고 구독자 배포까지 시작한 단계야.
Gemini Omni는 이미지·오디오·영상·텍스트를 입력으로 받아 고품질 영상을 만드는 모델이야. 핵심은 대화로 영상을 고친다는 거야. 캐릭터가 장면마다 일관되게 유지되고, 물리도 그럴듯하게 맞고, 장면이 앞에 뭐가 나왔는지 기억해. 데모에는 조각상을 거품으로 바꾸거나, 끝없이 반복되는 방을 만들거나, 바이올린 연주자를 다른 배경으로 옮기는 사례가 들어 있어. 지금 Google AI Plus·Pro·Ultra 구독자한테 Gemini 앱과 Flow로 풀리는 중이고, 개발자와 기업용 API도 이어진대.
Gemini 3.5 Flash는 “똑똑함에 실행을 붙인” 에이전트형 모델이야. 여러 단계를 알아서 밟는 에이전트 작업과 코딩에 강하고, 데모에서는 결제 화면 UI를 60초 만에 짜 보였어. 무엇보다 이 모델이 이제 Gemini 앱과 검색 AI 모드의 글로벌 기본 모델이 됐다는 게 실무에선 가장 큰 변화야. 정보 에이전트랑 검색용 생성 UI는 올여름에 더 풀린다고 했어.
다만 이건 구글이 직접 고른 데모라는 걸 감안해야 해. 가장 잘 되는 사례를 보여준 거라, 영상 편집 일관성이나 60초 UI 생성이 일반 사용에서도 같은 품질일지는 써 보면서 따로 확인하는 게 맞아.