Gemini 代理是 Google I/O 2026 最核心的概念,這次發布會的目標是把 AI 從單一聊天視窗,擴展到 Google 搜尋、App、網購與智能眼鏡等多種使用場景。
核心重點就是「Gemini 代理」
今年的主要更新可分成兩條主線,一是模型層面推出新一代家族與世界模型,二是產品層面把這些模型放進搜尋、Gemini App、Workspace、Shopping 與 Maps 等服務,並賦予它們「代理」能力,讓系統能主動執行任務,而不再只等用戶提問。
對使用者而言,關注重點可粗分為幾類:
- 每日必用:Google 搜尋與 Gemini App(Daily Brief、Spark)
- 創作與內容:Gemini Omni 世界模型、Google Flow、Google Pics
- 網購與支付:Universal Cart 與 UCP/AP2
- 未來介面:智能眼鏡與 Project Genie 街景沙盒
1. Gemini 3.5 Flash:所有代理的新引擎

Gemini 3.5 Flash 是 3.5 家族中首度推出的引擎,官方將它定位為處理長流程、持續迭代任務與程式開發工作的高效模型,重點在於前沿智能水準與更高的輸出速度,且單位成本更低。
Google 表示,在多項測試中,Gemini 3.5 Flash 整體表現超越上一代 Gemini 3.1 Pro,尤其在程式撰寫、長期任務規劃,以及多項實戰基準測試中拉開差距。Flash 在輸出 token 的速度上約為其他前沿模型的四倍,讓 Google 能以相同硬體預算,支撐更多用戶與更多背景的代理服務。
這個模型不僅提供給開發者使用,亦已成為 Google 內部多項產品的預設引擎,包括 Gemini App、AI 搜尋模式(AI Mode)、Antigravity 開發平台與企業版 Gemini Enterprise,未來許多搜尋摘要與助理功能都將由此引擎處理。
2. Gemini Omni:影片層面的世界模型
如果把 Gemini 3.5 Flash 視為大腦,Gemini Omni 則是用來理解與重寫現實影像的感官系統。Omni 被描述為世界模型,它能同時處理文字、圖片、聲音與現有影片作為輸入,並生成高品質影片,且能在多輪對話中逐步修改場景與動作。
首發版本為 Gemini Omni Flash,針對影片創作:使用者可以上傳手機拍攝的短片,再以自然語言指示改變光線、替換背景、調整鏡頭,或改寫故事走向,Omni 會嘗試維持角色一致性、物理合理性及畫面連貫,形成可透過語音或文字「重拍」的時間軸式編輯流程。
在發佈策略上,Omni Flash 將先提供給 Gemini AI Plus/Pro/Ultra 訂閱者,透過 Gemini App 與 Google Flow 使用,同時會免費整合到 YouTube Shorts 與 YouTube Create App,之後再透過 API 開放給開發者與企業。所有 Omni 生成的影片都會加入 SynthID 水印,並在 Gemini App、Chrome 與 Google 搜尋中提供 Content Credentials 檢查機制。
3. Gemini App、Daily Brief、Spark:從助理到常駐代理
Gemini App 本身進行大幅改造,介面採用全新「Neural Expressive」設計語言,加入更流暢的動畫與排版,並強化即時語音對話功能,使整體體驗由傳統打字工具,轉為更接近真人對話的互動型介面。
Daily Brief 是一個專門執行「AI 晨報」的代理程式,在你授權後會長期在背景讀取 Gmail、Calendar 與 Tasks,將重要郵件、即將到來的會議與待辦事項彙整為可快速掃描的早晨摘要,並依據你的目標排序優先事項與建議下一步行動。
Gemini Spark 則是全天候在 Google Cloud 運行的個人代理,核心由 Gemini 3.5 與 Antigravity 平台支援,可長時間執行多步驟任務,例如定期解析信用卡帳單以標示新訂閱、將會議記錄整理成 Google Docs,或透過 MCP 連接 Canva、OpenTable 與 Instacart 等第三方服務,實際替使用者完成訂位或下單等操作。
Spark 將先推給受信任測試者,之後於美國提供給 Google AI Ultra 訂閱用戶 Beta,並預計於今年夏天在 Chrome 中以「agentic browser」形式推出。
4. AI 搜尋:Information Agents 與生成式使用者介面
搜尋仍是 Google 生態的核心產品,這次正式推進「agentic 搜尋時代」,意味著搜尋功能會主動為使用者長期追蹤資訊與執行任務。
新的 AI Mode 已全面改用 Gemini 3.5 Flash 作為底層模型,提供更快的回應速度、更長的上下文理解能力與更複雜的推理表現。新增的 information agents 允許用戶為特定主題建立專屬代理,例如找房、追蹤股票或關注運動員聯名鞋款,代理會在背景監測資訊並在符合條件時整理重點通知使用者。
同時,Search 現在能依據提問動態生成生成式 UI,包括互動圖像、表格與模擬工具,甚至為長期任務建立持久化的儀表板或追蹤器,讓搜尋結果更像一個為你量身定做的小型應用程式。

這些生成式 UI 功能預計今年夏天向所有搜尋用戶免費開放,而客製化儀表板與以 Antigravity 建立的專屬體驗,初期則會先提供給美國的 Google AI Pro/Ultra 訂閱者。
5. Universal Cart 與 UCP/AP2:重新設計網購流程
在電商領域,Google 推出 Universal Cart(通用購物車),目標是把散落在搜尋、Gemini、YouTube 與 Gmail 的購物行為整合到同一個智能購物車中,使用者在任何接觸點看到商品,都能一鍵加入這個 Cart。

商品加入後,Cart 會在背景自動尋找折扣、追蹤歷史價格、監控庫存狀態並在變動時通知使用者。若你在組裝電腦,Cart 會檢查零件相容性、標示風險並建議替代方案。購物體驗建基於 Google Wallet,Cart 也會考量信用卡回饋、會員積分與商戶優惠,協助選擇最划算的付款方式。
底層由 Universal Commerce Protocol(UCP) 建構代理與商戶之間的通用語言,Agent Payments Protocol(AP2) 則負責設定支付邊界,讓使用者可以限制代理只在指定商戶與金額範圍內代為付款,並透過隱私保護與防篡改紀錄提高安全性。Universal Cart 今夏會先在美國的搜尋與 Gemini App 上線,並在多個大型商戶提供一鍵結帳功能。

6. 智能眼鏡與 Project Genie:AI 走出螢幕
硬體方面,Google 展示了其智能眼鏡路線,包括提供語音協助的 audio glasses 與能在視野中顯示資訊的 display glasses,兩者都會連接 Gemini,使用者可透過語音查路線、查詢資料或接收提醒,同時保持雙手空出與目光向前。audio glasses 預計今年秋季先行推出。
同期亮相的 Project Genie 則把多年 Street View 資料與生成式 AI 結合,將真實街區變成可編輯的 3D 沙盒:使用者可以改變建築外觀、調整街道佈局或加入虛構元素,為建築設計、城市規劃與遊戲開發提供在 AI 世界先行試驗的環境。

Google 設想這兩項技術與 Gemini 及 Antigravity 平台互通:你可以先在桌面用 Genie 改造某條街,再戴上智能眼鏡在現場以「未來版本」街景做覆疊,或由遊戲開發者用 Genie 生成關卡原型,再以 Omni 產生宣傳片段。
7. Content Credentials 與 SynthID:建立 AI 內容透明度基礎
面對生成式影像與影片日益難以辨識來源,Google 擴展了 SynthID 水印 與 Content Credentials 驗證工具。官方表示,SynthID 已在過去三年內應用於超過一千億張圖片與影片,以及等同六萬年長度的音訊素材,並在 Gemini App 提供檢測工具。
今年,Google 把這套工具延伸到 Google 搜尋與 Chrome,讓使用者在瀏覽網頁時更容易檢查圖片與影片是否由 AI 生成或經過生成式工具編輯。在合作夥伴方面,除了早已加入的 Nvidia,OpenAI、Kakao 與 ElevenLabs 也宣布採用 SynthID,嘗試建立跨平台的 AI 內容標準。
你願意把多少事交給長駐的數位代理?

從本次 I/O 可見,Google 最大的改變不是新增幾項 AI 功能,而是把 Gemini 代理打造為一套從模型、平台到產品的完整系統:Google 搜尋長期追蹤資訊,Gemini App 透過 Daily Brief 與 Spark 幫你處理日常瑣事,Universal Cart 幫你做網購決策,智能眼鏡與 Project Genie 則嘗試把代理能力疊加到現實世界之上。
真正值得關注的問題是:你願意,也相信,可以把多少生活與工作流程交給一個長駐雲端的數位代理?這個答案,可能會隨著你開始使用 AI 搜尋與 Gemini App 的新功能而逐漸浮現。

