Gemini代理：Google I/O 2026将AI从聊天扩展到搜索与应用

Gemini代理是Google I/O 2026的核心，目标是把AI从一个聊天窗口扩展到搜索、App、网购，甚至你戴在面前的智能眼镜里。这是Google今年最大的产品愿景变化，意在把模型、平台与应用连成一套长期运行的代理系统。

核心要点：Gemini代理

今年的主要更新围绕两条主线展开：一是模型层面，推出Gemini 3.5 家族与世界模型Gemini Omni，二是产品层面，把模型嵌入Search、Gemini App、Workspace、Shopping与Maps等产品，赋予它们长期运行的代理能力。Google的目标是让AI主动执行任务，而不是被动等待用户每次提问。

对用户来说，核心关注点可以粗分为几组：日常使用、内容创作、网购支付、以及未来交互界面。这些分类决定了不同产品和订阅的优先级与开放节奏。

每日必用：Google 搜索＋Gemini App（Daily Brief、Spark）
创作与内容：Gemini Omni 影片世界模型、Google Flow、Google Pics
网购与支付：Universal Cart＋UCP／AP2
未来界面：智能眼镜＋Project Genie 街景沙盒

1. Gemini 3.5 Flash：所有代理的新引擎

Gemini 3.5 Flash是3.5家族中率先推出的模型，Google把今年大部分新能力绑定在这颗引擎上。Flash主打更高的推理能力、更快的输出速度与更低的运算成本，适合长流程、多轮迭代的代理任务与软件开发场景。

官方表示，Gemini 3.5 Flash在多项基准测试中超过上一代Gemini 3.1 Pro，尤其在编程、长期任务规划与高经济价值的实战测评上拉开距离。它在输出token速度上约为同类前沿模型的四倍，因而能用同样硬件预算支撑更多并发Agent与用户请求。

这款模型不仅面向开发者，也已成为Google自家产品的默认引擎：Gemini App、AI搜索模式（AI Mode）、Antigravity开发平台以及企业版Gemini Enterprise都开始以3.5 Flash作为底层模型。这意味着用户在搜索摘要、应用内问路或协助写稿时，背后很可能是这颗引擎在执行。

2. Gemini Omni：影片层面的世界模型

如果把Gemini 3.5 Flash看作“脑”，那么Gemini Omni就是Google用来理解并重写现实世界影像的“感官”。Omni被定位为世界模型，能以文字、图片、声音与现有视频作为输入，生成高质量影片，并在多轮对话中逐步修改场景与动作。

首款推出的是Gemini Omni Flash，先针对影片生成场景优化与重拍功能：用户可以上传手机拍摄的视频，用自然语言要求调整光线、更换背景、改变镜头语言，甚至改写故事走向，Omni会保持角色一致与物理合理性，输出连贯的时间轴。用语音或文本即可实现对现有素材的“重拍”。

在发布策略上，Omni Flash将优先开放给Gemini AI Plus／Pro／Ultra订阅用户，通过Gemini App与Google Flow使用，并免费接入YouTube Shorts与YouTube Create App，随后通过API面向开发者与企业开放。所有Omni生成的视频都会嵌入SynthID水印，并支持Content Credentials校验。

3. Gemini App、Daily Brief与Spark：从助理到全天候代理

Gemini App进行了界面重构，采用名为Neural Expressive的新设计语言，加入更流畅的动画与色彩，并支持Gemini Live的实时语音对话，体验从文字工具向更接近真人对话的界面靠拢。交互更自然，使用门槛更低。

Daily Brief是一个专门负责“AI晨报”的agent，获授权后会在后台长期读取你的Gmail、日历与任务，整理紧急邮件、重要会议与待办事项为一份可快速浏览的早间摘要，并按目标给出优先级与下一步建议。它的设计旨在减少早晨的信息筛选成本。

Gemini Spark是一个24/7运行于Google Cloud的个人AI agent，基于Gemini 3.5与Antigravity harness，可长期执行多步骤任务，例如定期解析信用卡月结单识别新订阅、整理会议纪要为Google Docs，甚至通过MCP对接Canva、OpenTable、Instacart等第三方服务代为执行。Spark将先向受邀测试者开放，随后在美国以Beta形式向Google AI Ultra订阅用户推广。

4. AI搜索：Information Agents与生成式界面

搜索仍是Google生态的核心产品，今年正式推进为“agentic搜索时代”。AI Mode已全面改用Gemini 3.5 Flash作为底层模型，以提供更快的响应、更长的上下文窗口与更复杂的推理能力。搜索开始承担长期监测与主动提醒的角色。

新的information agents允许用户为某一主题（例如找房、跟进股票或追踪球员联名鞋款）建立专属agent，长期在后台监控相关信息，一旦出现符合条件的更新就自动整理要点并通知你。同时，Search会根据提问动态生成generative UI，包含互动图像、表格与模拟工具，还能为长期任务建立持久的仪表盘或跟踪器，变成只为你量身定制的“迷你应用”。

这些生成式界面功能预计今年夏天向所有Search用户免费开放，而自定义仪表盘以及基于Antigravity构建的定制体验，初期将优先提供给美国的Google AI Pro与Ultra订阅用户。部分高级agent和定制体验会与订阅服务绑定。

5. Universal Cart、UCP与AP2：AI重构网购流程

Universal Cart（通用购物车）旨在把分散于Search、Gemini、YouTube、Gmail中的购物行为整合到一个智能购物车中。用户在搜索产品、与Gemini交互或查看YouTube开箱时，都可以把商品加入同一购物车，并在后台由系统持续优化结算建议。

购物车一旦有商品加入，就会在后台查找折扣、追踪历史价格、监测缺货与补货状态，并在价格或库存发生变化时通知用户。若你在组装电脑，Cart会检查零件兼容性并建议替代方案。购物车还会结合Google Wallet信息，优化付款方式以获取最高回报。

底层由Universal Commerce Protocol（UCP）构建，负责在代理与商户之间建立通用语义；而Agent Payments Protocol（AP2）则用于设定支付边界，让用户限制代理仅在指定商户或金额范围内代付，同时通过隐私与防篡改记录提升安全。Universal Cart将于今夏在美国部分渠道上线，并支持多家大型零售商的一键结账。

6. 智能眼镜与Project Genie：AI走出屏幕

在硬件方面，Google展示了自家的智能眼镜路线，包含提供语音助手功能的audio glasses与可在视野中显示信息的display glasses，两者均会与Gemini联通，支持语音查询路线、获取即时信息或接收提示。audio glasses预计今年秋季先行推出。

Project Genie则把多年Street View数据结合生成式AI，构建可编辑的3D街景沙盒：用户可以改变建筑外观、调整街道布局或添加虚构元素，为建筑设计、城市规划与游戏开发提供一个可在AI世界中先行试错的空间。这将把虚拟改造叠加到现实场景之上。

在Google的设想中，Genie与智能眼镜将与Gemini及Antigravity平台互通：你可以先在桌面用Genie改造街区，再戴上眼镜在现场以“未来版本”街景进行叠加预览；游戏开发者也可用Genie生成关卡原型，再用Omni生成宣传片段。工具链的互联是Google的核心思路。

7. Content Credentials与SynthID：生成内容的可溯源基础设施

面对生成式图像与视频愈加难以分辨真伪的挑战，Google扩展了SynthID水印与Content Credentials的检测与校验能力。SynthID三年前推出，迄今已在上百亿张图片与视频，以及相当于数万年长度的音频素材上加注不可见水印。这是Google强化内容透明度的技术路径。

今年Google把该工具链扩展到Search与Chrome，方便用户在浏览网页时核验图片与视频是否由AI生成或经过编辑。除了早期合作的Nvidia之外，OpenAI、Kakao与ElevenLabs也宣布采用SynthID，试图推动跨平台的AI内容标准。多方合作有助于行业建立统一的可溯源机制。

你愿意把多少事务交给长期运行的AI代理？

从今年I/O来看，Google的最大变化不是增加了多少AI功能，而是把Gemini代理构建成一套从模型到平台再到产品的完整系统。Search用于长期追踪、Gemini App通过Daily Brief与Spark处理日常事务、Universal Cart优化购物决策，而智能眼镜与Genie则尝试把这类代理能力叠加到现实世界。

真正值得关注的问题是：你愿意并相信把多少生活与工作流程交给一个长期驻云端的数字代理？这个问题的答案，可能在你开始使用AI Search或Gemini App新功能时逐步显现。

Search

Gemini代理：Google I/O 2026将AI从聊天扩展到搜索与应用

核心要点：Gemini代理

1. Gemini 3.5 Flash：所有代理的新引擎

2. Gemini Omni：影片层面的世界模型

3. Gemini App、Daily Brief与Spark：从助理到全天候代理

4. AI搜索：Information Agents与生成式界面

5. Universal Cart、UCP与AP2：AI重构网购流程

6. 智能眼镜与Project Genie：AI走出屏幕

7. Content Credentials与SynthID：生成内容的可溯源基础设施

你愿意把多少事务交给长期运行的AI代理？

苹果iPad Air M3 登场，双尺寸选择，性能大跃进

AI.com网域名称叫价1亿美元，科技巨头争相抢占

Oris 星月系列：Star 与 Artelier 新表现场解读

江诗丹顿新品Watches & Wonders 2026亮相，五大亮点解析

卡地亚腕表Watches & Wonders 2026：结构与珠宝工艺一体化

Search

Gemini代理：Google I/O 2026将AI从聊天扩展到搜索与应用

核心要点：Gemini代理

1. Gemini 3.5 Flash：所有代理的新引擎

2. Gemini Omni：影片层面的世界模型

3. Gemini App、Daily Brief与Spark：从助理到全天候代理

4. AI搜索：Information Agents与生成式界面

5. Universal Cart、UCP与AP2：AI重构网购流程

6. 智能眼镜与Project Genie：AI走出屏幕

7. Content Credentials与SynthID：生成内容的可溯源基础设施

你愿意把多少事务交给长期运行的AI代理？

Related Posts

苹果iPad Air M3 登场，双尺寸选择，性能大跃进

AI.com网域名称叫价1亿美元，科技巨头争相抢占

Oris 星月系列：Star 与 Artelier 新表现场解读

江诗丹顿新品Watches & Wonders 2026亮相，五大亮点解析

卡地亚腕表Watches & Wonders 2026：结构与珠宝工艺一体化