Google 推出 Gemini Omni:不只是剪接工具
在 Seedance 2.0 已經教會新一代創作者「AI 可以幫你套濾鏡、改舞步、剪短片」之後,Google 這次在 I/O 搬出的 Gemini Omni,就不再滿足於做一個剪接加速器。它的出手位置高得多,直接站在 YouTube 這個最大長短片平台之上,用一個理解現實世界的影片世界模型,殺入原本由 TikTok 與抖音生態主導的 AI 影片戰場。Google 希望令你在 YouTube Shorts 同 Create App 內,都可以原生用 AI 重寫畫面,而不需要跳出平台另開一個工具。


從文字生影片到真正的世界模型
Gemini Omni 本質不是另一個展示用的工具,而是真正的 World Model (世界模型):它可以同時理解文字、圖片、聲音與影片,然後基於現實知識與物理規律去生成和編輯新畫面。去年爆紅的 Nano Banana 已經證明 Gemini 在靜態圖像生成有多厲害,這次 Omni 就是把同一套「先理解世界,再重建世界」的能力搬上影片時間軸,令 Creator 可以用對話方式逐層重寫作品。例如先叫它將旺角街拍變成 80 年代港產片色調,再加霓虹燈及緩慢推進鏡頭,同一段片一路進化,而不是三條完全不相關的濾鏡片段。
Omni 與 Seedance 的定位差異
同樣是 AI 影片,Seedance 偏向幫 TikTok 短影片做視覺爆發力:自動配樂、舞步、特效模板,一鍵製作出可以上抖音的版本;Omni 則強調世界模型與連戲邏輯,適合 Vlog、紀錄感內容、品牌故事與遊戲及電影前期視覺化。你拍一次實景,之後用文字改光線、改鏡頭、改場景,角色樣貌與物理效果都儘量保持一致。這個設計令權力由純剪接師推前到企劃與導演:不懂得拉關鍵影格都可以用自然語言控制畫面,而剪接師反而變成負責整合 Omni 輸出、統一節奏與做最後收尾的人。
落地應用與版權安全
落地方面,Omni Flash 會先透過 Gemini App 同 Google Flow 開放給 Google AI Plus、Pro 及 Ultra 訂閱用戶,同時免費滲入 YouTube Shorts 與 YouTube Create App,令 YouTube Creator 可以在原有工作流程裏面直接叫 Omni 出手,不用再在多個平台之間來回匯出與匯入。企業與開發者則可以經 Gemini API 把 Omni 變成自家雲端服務或品牌工具的一部份。考慮到造假風險,Google 為所有 Omni 生成影片加上不可見的 SynthID 水印,配合 Content Credentials 讓人一鍵查來源;另一方面對於改聲改口型這些敏感功能限制依然嚴格,公開版本主要集中在風格化與場景改寫,而不是任意扮演真人講話。
AI 影片戰場的下半場
放回平台戰的角度,Seedance 代表 ByteDance 已經用 AI 將 TikTok 變成一條高度自動化的內容流水線,而 Gemini Omni 則是 Google 在 YouTube 生態裏裝上的世界模型層,令 Creator 可以在不離開平台的情況下,匯入 AI 去改畫面、改風格同試多個版本。對香港的 Creator 來說,真正要思考的已經不是 AI 影片能否省時間,而是一句很簡單的自問:在 Seedance 已經改變剪接流程之後,你準備何時開始嘗試,用 Gemini Omni 在 YouTube 底層幫自己升級下一條影片?

