Google 在 I/O 2025 開發者大會上全方位展示 AI 創作工具的最新進展,推出全新 Imagen 4 圖像生成模型、進階影片 AI Veo3、拍攝助手 Flow,以及訂閱方案「Gemini Advanced with Ultra 1.5」,月費高達 250 美元(約港幣 HK$1,950)。這一系列產品標誌著 Google 在創作、設計及日常工作流程中大幅整合 AI 技術。
最新的 Imagen 4 作為圖像生成模型,其色彩、細節及構圖的準確度相較前一代有明顯提升。新模型專注於光影與材質的真實呈現,能準確地顯現水珠、光暈及金屬反光等細節。同時,生成圖片的速度提升達 10 倍,極大地減少用戶在修圖過程中的等候時間。再加上 Gemini 編輯功能,用戶還可以針對圖片的特定區域進行精細調整,進一步提升創作的靈活性。
另一項來自 Google DeepMind 的創新是 Veo3,這款高解析度影片生成工具可以輸出 1080p 畫質,並具備聲音輸出能力。它能理解自然語言提示,例如「延時拍攝的日落城市」,並轉化為具有電影效果的視頻片段。Veo3 不僅支持多種攝影技巧,如慢動作及空拍,還能根據使用者提供的素材作風格延伸,展現出強大的創意潛力。
Veo3 是 Google 的最先進影片生成模型,內部數據訓練涵蓋大量紀錄片和劇情片,反饋也相當積極。該工具即日起通過 Gemini App 和 AI 影片製作軟件 Flow 向美國的 Google AI Ultra 訂戶開放,企業用戶亦可通過 Vertex AI 平台使用這一新技術。
Flow 是專為影片創作者與導演設計的一套 AI 協作系統,用戶只需用語音指令,例如「拍攝一幕人物步出咖啡店的片段」,就能根據 preset 的鏡位、時間與環境自動安排拍攝流程。此系統會即時將指令傳送至手機、穿戴式裝置或其他攝錄設備,用戶也能藉手勢改變鏡頭位置或切換畫面。Google 更開放 Flow API,讓其他設備和軟件開發者可以整合這一技術於他們的產品中。未來此技術將率先在 Pixel 裝置、智慧眼鏡及特定拍攝硬體上使用,並可能延伸至 XR 或 AR 的應用場景。
同時,Google 還推出了全新高端訂閱方案「Gemini Advanced with Ultra 1.5」,這個方案的月費高達 250 美元(約港幣 HK$1,950),面向專業用戶市場。這個模型能處理多達 1,000 萬個字元的資料,且支援文本、圖片、影片及語音的跨模態處理,尤其適合需要整合大量複雜資料的職業,例如科研人員和內容分析專家。AI Ultra 用戶將能優先體驗 Veo3 的新功能,並無限使用 Flow 和其他運算密集型的 Deep Research 功能。
Gemini Advanced 將全面整合 Google 的應用程式,如 Gmail、Docs、Sheets 和 Slides,透過 Gemini 助理用戶將能自動草擬、修飾及摘要文件,大大提高工作效率。將來,Pixel 裝置的用戶還將享受即時語音轉寫、錄音整理及搜尋摘要等功能,進一步強化 AI 在日常工作和生活中的支援角色。


