Gemini 代理系統出列：解析 Google I/O 2026 全面AI戰略

Gemini 代理是 Google I/O 2026 最核心的概念，這次發布會的目標是把 AI 從單一聊天視窗，擴展到 Google 搜尋、App、網購與智能眼鏡等多種使用場景。

核心重點就是「Gemini 代理」

今年的主要更新可分成兩條主線，一是模型層面推出新一代家族與世界模型，二是產品層面把這些模型放進搜尋、Gemini App、Workspace、Shopping 與 Maps 等服務，並賦予它們「代理」能力，讓系統能主動執行任務，而不再只等用戶提問。

對使用者而言，關注重點可粗分為幾類：

每日必用：Google 搜尋與 Gemini App（Daily Brief、Spark）
創作與內容：Gemini Omni 世界模型、Google Flow、Google Pics
網購與支付：Universal Cart 與 UCP／AP2
未來介面：智能眼鏡與 Project Genie 街景沙盒

1. Gemini 3.5 Flash：所有代理的新引擎

Gemini 3.5 Flash 是 3.5 家族中首度推出的引擎，官方將它定位為處理長流程、持續迭代任務與程式開發工作的高效模型，重點在於前沿智能水準與更高的輸出速度，且單位成本更低。

Google 表示，在多項測試中，Gemini 3.5 Flash 整體表現超越上一代 Gemini 3.1 Pro，尤其在程式撰寫、長期任務規劃，以及多項實戰基準測試中拉開差距。Flash 在輸出 token 的速度上約為其他前沿模型的四倍，讓 Google 能以相同硬體預算，支撐更多用戶與更多背景的代理服務。

這個模型不僅提供給開發者使用，亦已成為 Google 內部多項產品的預設引擎，包括 Gemini App、AI 搜尋模式（AI Mode）、Antigravity 開發平台與企業版 Gemini Enterprise，未來許多搜尋摘要與助理功能都將由此引擎處理。

2. Gemini Omni：影片層面的世界模型

如果把 Gemini 3.5 Flash 視為大腦，Gemini Omni 則是用來理解與重寫現實影像的感官系統。Omni 被描述為世界模型，它能同時處理文字、圖片、聲音與現有影片作為輸入，並生成高品質影片，且能在多輪對話中逐步修改場景與動作。

首發版本為 Gemini Omni Flash，針對影片創作：使用者可以上傳手機拍攝的短片，再以自然語言指示改變光線、替換背景、調整鏡頭，或改寫故事走向，Omni 會嘗試維持角色一致性、物理合理性及畫面連貫，形成可透過語音或文字「重拍」的時間軸式編輯流程。

在發佈策略上，Omni Flash 將先提供給 Gemini AI Plus／Pro／Ultra 訂閱者，透過 Gemini App 與 Google Flow 使用，同時會免費整合到 YouTube Shorts 與 YouTube Create App，之後再透過 API 開放給開發者與企業。所有 Omni 生成的影片都會加入 SynthID 水印，並在 Gemini App、Chrome 與 Google 搜尋中提供 Content Credentials 檢查機制。

3. Gemini App、Daily Brief、Spark：從助理到常駐代理

Gemini App 本身進行大幅改造，介面採用全新「Neural Expressive」設計語言，加入更流暢的動畫與排版，並強化即時語音對話功能，使整體體驗由傳統打字工具，轉為更接近真人對話的互動型介面。

Daily Brief 是一個專門執行「AI 晨報」的代理程式，在你授權後會長期在背景讀取 Gmail、Calendar 與 Tasks，將重要郵件、即將到來的會議與待辦事項彙整為可快速掃描的早晨摘要，並依據你的目標排序優先事項與建議下一步行動。

Gemini Spark 則是全天候在 Google Cloud 運行的個人代理，核心由 Gemini 3.5 與 Antigravity 平台支援，可長時間執行多步驟任務，例如定期解析信用卡帳單以標示新訂閱、將會議記錄整理成 Google Docs，或透過 MCP 連接 Canva、OpenTable 與 Instacart 等第三方服務，實際替使用者完成訂位或下單等操作。

Spark 將先推給受信任測試者，之後於美國提供給 Google AI Ultra 訂閱用戶 Beta，並預計於今年夏天在 Chrome 中以「agentic browser」形式推出。

4. AI 搜尋：Information Agents 與生成式使用者介面

搜尋仍是 Google 生態的核心產品，這次正式推進「agentic 搜尋時代」，意味著搜尋功能會主動為使用者長期追蹤資訊與執行任務。

新的 AI Mode 已全面改用 Gemini 3.5 Flash 作為底層模型，提供更快的回應速度、更長的上下文理解能力與更複雜的推理表現。新增的 information agents 允許用戶為特定主題建立專屬代理，例如找房、追蹤股票或關注運動員聯名鞋款，代理會在背景監測資訊並在符合條件時整理重點通知使用者。

同時，Search 現在能依據提問動態生成生成式 UI，包括互動圖像、表格與模擬工具，甚至為長期任務建立持久化的儀表板或追蹤器，讓搜尋結果更像一個為你量身定做的小型應用程式。

這些生成式 UI 功能預計今年夏天向所有搜尋用戶免費開放，而客製化儀表板與以 Antigravity 建立的專屬體驗，初期則會先提供給美國的 Google AI Pro／Ultra 訂閱者。

5. Universal Cart 與 UCP／AP2：重新設計網購流程

在電商領域，Google 推出 Universal Cart（通用購物車），目標是把散落在搜尋、Gemini、YouTube 與 Gmail 的購物行為整合到同一個智能購物車中，使用者在任何接觸點看到商品，都能一鍵加入這個 Cart。

商品加入後，Cart 會在背景自動尋找折扣、追蹤歷史價格、監控庫存狀態並在變動時通知使用者。若你在組裝電腦，Cart 會檢查零件相容性、標示風險並建議替代方案。購物體驗建基於 Google Wallet，Cart 也會考量信用卡回饋、會員積分與商戶優惠，協助選擇最划算的付款方式。

底層由 Universal Commerce Protocol（UCP） 建構代理與商戶之間的通用語言，Agent Payments Protocol（AP2） 則負責設定支付邊界，讓使用者可以限制代理只在指定商戶與金額範圍內代為付款，並透過隱私保護與防篡改紀錄提高安全性。Universal Cart 今夏會先在美國的搜尋與 Gemini App 上線，並在多個大型商戶提供一鍵結帳功能。

6. 智能眼鏡與 Project Genie：AI 走出螢幕

硬體方面，Google 展示了其智能眼鏡路線，包括提供語音協助的 audio glasses 與能在視野中顯示資訊的 display glasses，兩者都會連接 Gemini，使用者可透過語音查路線、查詢資料或接收提醒，同時保持雙手空出與目光向前。audio glasses 預計今年秋季先行推出。

同期亮相的 Project Genie 則把多年 Street View 資料與生成式 AI 結合，將真實街區變成可編輯的 3D 沙盒：使用者可以改變建築外觀、調整街道佈局或加入虛構元素，為建築設計、城市規劃與遊戲開發提供在 AI 世界先行試驗的環境。

Google 設想這兩項技術與 Gemini 及 Antigravity 平台互通：你可以先在桌面用 Genie 改造某條街，再戴上智能眼鏡在現場以「未來版本」街景做覆疊，或由遊戲開發者用 Genie 生成關卡原型，再以 Omni 產生宣傳片段。

7. Content Credentials 與 SynthID：建立 AI 內容透明度基礎

面對生成式影像與影片日益難以辨識來源，Google 擴展了 SynthID 水印 與 Content Credentials 驗證工具。官方表示，SynthID 已在過去三年內應用於超過一千億張圖片與影片，以及等同六萬年長度的音訊素材，並在 Gemini App 提供檢測工具。

今年，Google 把這套工具延伸到 Google 搜尋與 Chrome，讓使用者在瀏覽網頁時更容易檢查圖片與影片是否由 AI 生成或經過生成式工具編輯。在合作夥伴方面，除了早已加入的 Nvidia，OpenAI、Kakao 與 ElevenLabs 也宣布採用 SynthID，嘗試建立跨平台的 AI 內容標準。

你願意把多少事交給長駐的數位代理？

從本次 I/O 可見，Google 最大的改變不是新增幾項 AI 功能，而是把 Gemini 代理打造為一套從模型、平台到產品的完整系統：Google 搜尋長期追蹤資訊，Gemini App 透過 Daily Brief 與 Spark 幫你處理日常瑣事，Universal Cart 幫你做網購決策，智能眼鏡與 Project Genie 則嘗試把代理能力疊加到現實世界之上。

真正值得關注的問題是：你願意，也相信，可以把多少生活與工作流程交給一個長駐雲端的數位代理？這個答案，可能會隨著你開始使用 AI 搜尋與 Gemini App 的新功能而逐漸浮現。

Search