谷歌放大招:把AI智能体塞进搜索、浏览器、手机和眼镜,Gemini 3.5 Flash、视频模型Omni与AI助手Spark齐发!一文看懂2026年谷歌I/O大会→
创始人
2026-05-20 13:20:28
0

每经记者:岳楚鹏 每经编辑:段炼,高涵

北京时间5月20日凌晨1点,谷歌I/O 2026开发者大会在美国加州山景城开幕。

与往年相比,今年这场发布会的重点,不是某一个模型或功能,而是一次系统性转向——谷歌正把AI智能体全面“塞进”所有核心入口。

从搜索框到Chrome浏览器,从Android手机到智能眼镜,Gemini不再只是一个对话助手,而是一个可以持续运行、跨应用执行任务的AI代理:它能替用户追踪信息、生成内容、调用工具,甚至直接完成下单和操作流程。

在开场演讲中,谷歌CEO桑达尔·皮查伊(Sundar Pichai)表示,过去12个月是谷歌“飞速发展”的一年。谷歌每月处理的Token数量达到3.2千万亿个,同比增长7倍;Gemini应用月活跃用户数达9亿。

截至美股5月19日收盘,谷歌A跌2.34%。

谷歌每月Token处理量 图片来源:直播视频截图

Gemini月活跃用户数 图片来源:直播视频截图

Ask YouTube:AI视频搜索

进入“对话+跳转片段”时代

在大会开场后的产品展示中,谷歌首先介绍了YouTube和办公场景中的AI功能。

谷歌推出“Ask YouTube”功能。该功能将在YouTube网站中加入聊天机器人式交互界面,用户可以通过自然语言引导系统找到更符合搜索意图的视频片段,并直接跳转至视频中的相关部分。谷歌表示,该功能目前正在测试,并计划于今年夏季在美国更广泛推出。

随后,谷歌展示了Docs Live。不同于传统文档编辑工具,Docs Live允许用户直接通过语音与Google Docs对话,而不必输入具体提示词。现场演示中,一名用户需要为高中职业日准备校友演讲,Gemini自动提取演讲要点,从Google Drive中获取简历信息,并从Gmail中调取活动详情,随后帮助用户创建和编辑文档。

从TPU 8到Gemini 3.5 Flash:

谷歌全面升级AI底层与生成能力

在介绍应用层功能后,皮查伊转向AI基础设施。皮查伊表示,谷歌AI基础设施支出正在大幅增长,预计今年的支出将达到1800亿美元~1900亿美元。

谷歌资本支出 图片来源:直播视频截图

谷歌还重点介绍了自研AI硬件TPU(张量处理单元)。谷歌称,最新一代TPU 8将分为两类:一类面向大规模AI训练,另一类用于模型实际服务用户时的快速响应。

谷歌最新训练用TPU 8t 图片来源:直播视频截图

随后,DeepMind首席执行官德米斯·哈萨比斯(Demis Hassabis)登台介绍“世界模型”相关进展,并发布Gemini Omni。这是一款基于谷歌在世界模型方面积累的新型视频生成模型。按照谷歌的介绍,Gemini Omni可以基于多种输入生成视频,并支持对话式编辑。用户可以通过自然语言修改角色、背景和场景,也可以上传自拍并将其转换成其他风格或内容。哈萨比斯称,未来Omni将能够根据任何输入生成任何输出,首款模型Gemini Omni Flash将于今年夏季推出。

Gemini Omni 图片来源:直播视频截图

围绕AI生成内容识别,谷歌还扩展了SynthID验证功能。用户可以询问一张图片是否由AI生成。皮查伊现场以一张他和另外几个科技巨头CEO的梗图为例,展示该AI检测能力。

皮查伊测试SynthID能力 图片来源:直播视频截图

皮查伊随后发布Gemini 3.5 Flash。他表示,该模型比此前Gemini 3.1速度更快,专为更复杂的智能体任务、更长工作流和现实世界开发者使用场景构建。谷歌称,Gemini 3.5 Flash生成输出Token的速度大约是其他前沿模型的4倍,因此尤其适合AI Agent和编码工具。

Gemini 3.5 Flash生成速度为其他模型的四倍 图片来源:直播视频截图

Antigravity与Gemini Spark:

智能体从编程走向个人助理

模型发布之后,谷歌的软件开发平台Antigravity负责人瓦伦・莫汉(Varun Mohan)登台介绍智能体编程平台Antigravity 2.0。

该平台被谷歌定位为面向AI Agent时代的编程工具,直接对标Anthropic的Claude Code和OpenAI的Codex。瓦伦・莫汉称,谷歌通过Antigravity 2.0及其代理系统从零开始构建一个操作系统,整个过程所消耗的Token成本不到1000美元。他还表示,Antigravity 2.0“毫不掩饰地以智能体为先”。

谷歌Antigravity 图片来源:直播视频截图

紧接着,皮查伊发布Gemini Spark。谷歌将其定义为一款全天候运行的个人AI助手,基于Gemini 3.5,并运行在Google Cloud虚拟机上。用户可以通过Gemini应用访问Spark。按照谷歌的说法,即便用户合上笔记本电脑,Spark也可以继续工作,同时也能在智能手机上运行。

谷歌表示,Gemini Spark未来将与第三方工具集成,相关工具将陆续公布。该功能本周将面向受信任测试人员推出,下周面向美国Google AI Ultra订阅用户开放。为了降低成本,谷歌还推出价格更低的Ultra套餐,起始价为100美元/月。今年夏天,Spark也将在Chrome浏览器中运行。

Gemini Spark 图片来源:直播视频截图

谷歌还展示了如何通过Gemini Spark 来策划街区派对。

在演示中,Spark 汇总了所有回复,追踪了每位参与者携带的物品,自动向尚未回复的邻居发送了后续邮件,并在 Google Sheets 中创建了一个实时回复追踪器。它还生成了一份 Google Slides 派对宣传册,其中包含了充气城堡和社区规则等详细信息,这些信息都来自 Google Drive 中的文件。

Gemini Spark演示 图片来源:直播视频截图

谷歌还计划发布Android Halo,用于承载其在安卓手机平台上的AI智能体。按照谷歌的设想,Android Halo将成为手机上AI智能体运行状态和任务进展的可视化入口。

Android Halo 图片来源:直播视频截图

AI Mode和AI Overview:

谷歌用智能体重构搜索

随后,谷歌搜索副总裁伊丽莎白•里德(Liz Reid)登台,介绍AI Mode和AI Overview相关进展。

谷歌推出全新的搜索框。新搜索框不仅具备传统自动补全能力,还能提供AI生成的搜索建议,并支持多模态搜索,允许用户在搜索请求中上传照片和视频。

谷歌搜索新搜索框 图片来源:直播视频截图

更大的变化是AI智能体进入搜索。谷歌介绍,全新推出的信息智能体可以全天候在后台运行,用于回答“极其复杂”的问题,例如追踪特定行业的市场动态。用户无需反复手动搜索,智能体可以持续监控网络,并在相关信息发生变化时更新结果。谷歌计划在今年夏季推出这类智能体,并在之后增加更多专业化代理。

信息智能体 图片来源:直播视频截图

谷歌搜索产品副总裁罗比·斯坦(Robbie Stein)介绍,AI Mode还将接入Antigravity的编码能力。谷歌称,搜索未来可以在交互界面中生成可交互画面,并帮助用户创建“迷你应用”。例如,当用户想寻找周末适合全家参与的娱乐活动时,搜索可以从零开始生成一个周末活动计划表。

AI Mode演示 图片来源:直播视频截图

Universal Cart:AI智能体升级购物体验

能追踪优惠、监控价格

在搜索之后,谷歌广告和商务副总裁Vidhya Srinivasan登台展示同样具有智能体元素的购物相关功能。

图片来源:直播视频截图

谷歌宣布了一系列全球合作关系。相关合作将使用开源的通用商业协议,服务也将扩展到美国以外的新地区。

图片来源:直播视频截图

谷歌还发布了Universal Cart。这是一款由AI智能体驱动的通用购物车,可在Google服务中使用,包括搜索和Gemini应用,后续还将支持YouTube和Gmail。用户在搜索、与Gemini聊天、观看YouTube或阅读Gmail时,都可以把商品加入同一个购物车。

谷歌称,Universal Cart可以追踪优惠、监控价格变动、显示价格历史、在商品重新上架时提醒用户,甚至还能识别兼容性问题。例如,用户组装一台定制电脑时,如果某个部件不兼容,购物车可以进行提示。

Universal Cart演示 图片来源:直播视频截图

随后,谷歌介绍Gemini应用的重大更新。Gemini应用将采用新的Neural Expressive设计语言,带来包括交互式图像反馈、生成视频时间线在内的全新体验。Gemini Omni也将接入该应用,支持用户创建和编辑视频。

智能体也将加入Gemini应用。第一个名为“每日简报”,可以利用用户的Google服务信息,概览当天行程。高级用户还可以构建自己的智能体工作流。

每日简报 图片来源:谷歌

Android XR智能眼镜:

从导航到下单,无需掏手机

硬件方面,谷歌预告了由Gentle Monster、Warby Parker与三星合作推出的Android XR智能眼镜。这款智能眼镜将有两种形态:一种是可以与用户对话的语音眼镜,另一种是可以将信息投射到用户面前的显示眼镜。Gentle Monster和Warby Parker联名款属于语音眼镜,计划于今年秋季上市,并可与iOS和Android设备配对使用。

Android XR智能眼镜 图片来源:直播视频截图

现场演示中,谷歌人工智能与眼镜产品负责人Nishtha Bhatia使用智能眼镜点了一杯咖啡。Gemini为她导航到一家咖啡馆,打开手机中的DoorDash外卖平台,并准备好她常点的氮气冷萃咖啡订单。用户仍需最终批准下单,但Gemini已完成打开应用、找到饮品和准备订单等步骤,而手机始终放在口袋里。

智能眼镜演示 图片来源:直播视频截图

(免责声明:文章内容和数据仅供参考,不构成投资建议。投资者据此操作,风险自担。)

记者|岳楚鹏

相关内容

热门资讯

原创 苹... 有不少朋友疑惑苹果iPhone 16 Pro和16 Pro Max有什么区别?该选择哪一款更好?各自...
2024年OPPO手机全攻略:... 手机已不仅仅是通讯工具,它更是我们记录生活、享受娱乐、提升工作效率的重要伙伴。随着科技的飞速发展,O...
2025年值得入手的2款智能手... 在科技飞速发展的今天,智能手表已成为我们生活中不可或缺的伙伴。无论是健康监测、信息提醒,还是时尚搭配...
原创 2... 从去年华为用上了麒麟芯片开始,华为的市场份额就蹭蹭的往上涨,当时抢购的人特别多,一时间还买不到现货,...
第五轮学科评估对比:西安交大突... 在之前的文章中,我们已经提及西安交通大学第五轮学科评估的表现可圈可点,新晋的3个A+学科:机械工程、...
vivo手机5g开关在哪里打开 vivo手机5G开关的打开方式可能因手机型号、系统版本及运营商网络支持情况的不同而有所差异。但总体来...
原创 麒... 为了普及原生鸿蒙(鸿蒙5.0),抢占更多的中端手机市场份额,华为nova系列今年开始计划一年两更,n...
解决FaceTime无法使用的... FaceTime是苹果公司推出的一款视频通话应用,广泛应用于iPhone、iPad和Mac等设备上。...
steam官网无法访问?这个办... 对于广大游戏爱好者而言,Steam平台无疑是获取最新游戏资讯、购买游戏、与全球玩家互动的重要阵地。然...
原创 直... #热点周际赛# 随着科技的进步,儿童智能穿戴设备逐渐成为了家庭中的新宠。华为作为智能穿戴领域的领军者...