[文字转视频] [用广角镜头呈现数字10形状的空间站绕地球飞行] [使用Imagen和Veo生成] 好棒的视频,看来大家的制作过程应该很开心 大家上午好 欢迎参加Google I/O大会 欢迎亲临Shoreline会场的各位 以及世界各地在线上观看的观众 有人告诉我,双子座(Gemini季)从今天开始 我倒没觉得这有什么特别 因为对Google来说,每一天都是Gemini季 在I/O大会前的几周,我们通常不会有太多动作 因为我们想把最好的模型留到这个舞台上来展示 但在Gemini时代 我们也会在三月随便选个周二 发布我们最智能的模型 或是非凡的突破 就像在大会一周前发布AlphaEvolve那样 只想尽快将我们最好的模型交到你的手中 让你尽快体验到我们的产品 为此,我们的发布频率远超以往 自上届I/O大会至今 我们发布了十多种模型和研究突破 以及二十多种重要AI产品和功能 模型的快速进步让我振奋不已 从这张图表就能看出阶跃式的发展 Elo分数用来衡量进步的尺度 从第一代Gemini Pro至今 这项成绩提升了300多分 如今,Gemini 2.5 Pro 横扫LMArena排行榜的所有类别 在许多基准测试中都表现突出 在编程方面,我们也在快速进步 更新版的2.5 Pro在WebDev Arena中一马当先 Elo分数比上一个版本高142分 这款模型在各大主流编程平台上备受追捧 感谢所有人的支持 在领先AI代码编辑器cursor中 Gemini成为年度发展速度最快的模型 每分钟都有数十万行代码用它生成 最后这个里程碑或许最令人动容 至少在某些圈子里是如此 几周前,Gemini成功通关《宝可梦蓝》 集齐全部八枚徽章,挺进“冠军之路” 打败了四天王和联盟冠军 这让我们离实现API又近了一步 不过我们说的是“人工宝可梦智能” 所有这些进步都由我们卓越的基础设施提供支持 它是我们全栈式AI方法的基石 我们的第七代TPU Ironwood采用前沿设计 为大规模思考和推理赋能助力 其性能达到上一代的十倍 能迸发出每个pod 42.5 exaFLOPS的强大算力 令人赞叹 Google Cloud客户今年稍后就能切身体会它的实力 凭借始于底层TPU的基础设施实力 我们提供了速度更出众的模型 在LMArena排行榜的顶尖模型中 Gemini跻身前三 凭借最高的每秒生成token数 以及大幅下降的模型价格取得骄人成绩 在价格与性能之间权衡并不容易 然而,我们一次又一次地做到了 以最有效的价格点提供出色的模型 Google不仅在这个帕累托最优边界中先人一步 更从根本上改变了它 让每个人都能随时随地享受更好的智能体验 我们的努力收获了积极的回应 AI采用速度远超以往 作为进步的标志之一,在去年此时 我们所有产品和API 每个月的token处理总量是9.7万亿 而如今,每月token处理量达到了480万亿 短短一年,接近50倍的增幅 我们各类开发者AI工具的采用已成浪潮 在Google AI Studio和Vertex AI中 有700多万名开发者在使用Gemini API进行开发 达到去年召开I/O大会时的五倍多 自去年以来 Gemini在Vertex AI中的使用量增加到40多倍 我们的产品也在越来越多地采用AI Gemini应用的月活用户数已超过4亿 增长幅度和参与度都在强势增长 尤其是2.5版的模型 对于在Gemini应用中使用2.5 Pro模型的用户 使用量增长了45% 稍后你会听到许多与Gemini应用有关的消息 在搜索领域,我们也看到了十分惊人的发展势头 AI概览的月用户量现已超过15亿 也就是说,通过Google搜索使用生成式AI的用户量 超过全球其他任何产品 除了AI概览之外,AI模式也是搜索领域的一大进步 稍后我们会分享更多相关信息 所有这些进步都指向一件事 我们身处AI平台变革的新阶段 数十载的研究成果转化为实用工具 惠及普罗大众 我想分享三个例子 证明研究如何彻底改变我们当今的产品 分别是Project Starline、Astra和Mariner 在几年前的I/O大会上 我们公布了Project Starline 这是我们突破性的3D视频技术 让你在与千里之外的人交流时 也能有共处一室的感觉 我们不断改进相关技术 今天,我们终于准备好开启它的下一篇章 隆重介绍Google Beam 全新的AI优先型视频沟通平台 Beam运用全新的先进视频模型 将2D视频流转化为栩栩如生的3D体验 在幕后,六摄像头阵列从不同角度拍摄你的影像 这些视频流随后会通过AI合并在一起 生成3D光场显示,展示你的立体形象 它能实现毫米级精度的头部跟踪 以及每秒60帧的实时渲染 成就高度自然流畅、沉浸感十足的对话体验 我们热切期待将这项技术带给大家 并为此与惠普开展了合作 首款Google Beam设备 将于今年晚些时候与首批客户见面 从现在起的几周内,惠普会分享大量相关资讯 敬请关注 多年来,我们一直在不懈努力 将Starline的底层技术整合到Google Meet中 其中包括帮助打破语言壁垒的实时语音翻译 这个例子展示了在南美洲预定度假屋 而你又不会讲当地语言时 这项功能的实用价值 我们一起来看看吧 嗨,Camilla 我来打开语音翻译功能 终于能跟你直接对话了,太棒了 [西班牙语翻译] [西班牙语回答] 你会很开心的 我相信你也一定会爱上这座城市 这间房所在的社区环境很好,还能俯瞰山景 听起来真不错 [西班牙语翻译] [西班牙语回答] 附近就有公交车 不过我推荐你租辆车,这样去野外玩更方便 听起来不错 [西班牙语翻译] 如你所见,语音翻译惟妙惟肖地模仿了 讲话人的语气、模式甚至是表达方式 我们距离自然流畅的跨语言沟通又近了一步 我们现已直接将这种实时语音翻译功能 直接整合到Google Meet中 订阅者从现在起即可使用英语与西班牙语互译功能 在未来几周内,我们还会推出更多语言的翻译功能 实时翻译功能将于今年晚些时候面向企业用户开放 另一个在往届I/O舞台上正式亮相的 早期研究项目是Project Astra 专门探索通用型AI助手未来理解你身边世界的能力 我们正在将其整合到Google产品中 Gemini Live现已整合 Project Astra的相机和屏幕共享功能 支持就你看到的任何事物展开对话 人们正在将它用于各种用途 无论是为工作面试做练习 还是为备战马拉松而训练 我们始终高度重视可信测试员的反馈 还有一些不那么“可信”的测试员 一起来看看吧 好漂亮的敞篷车 我觉得你把垃圾车误认成敞篷车了 我还能帮你些什么? 这个细长的建筑物怎么杵在我家门口? 这是路灯,不是建筑物 这些棕榈树怎么这么矮?看着让人有点担心 它们并不矮,其实很高的 帅气的敞篷车 还是垃圾车 还有别的事吗? 为什么总有人把快递放到我的草坪上? 那不是快递,是个变电箱 我走路的时候,这个人怎么一直跟踪我 没人在跟踪你,那只是你的影子 Gemini真的特别擅长给你挑错 即日起,此功能面向所有Android和iOS用户开放 再说说我们的研究原型Project Mariner 这种智能体可以与Web交互并完成各种任务 我们跳出原有思维模式,将智能体视为一种系统 集先进AI模型的智能和访问工具的能力于一身 它们可以自主帮你执行操作,而且完全由你掌控 使用计算机是智能体的一项重要能力 让智能体能够与浏览器和其他软件交互 并对其执行操作 Project Mariner是测试计算机使用能力的初步尝试 去年12月,我们将其作为早期研究原型发布 自那之后取得了长足进展 首先,我们引入了多任务处理能力 它如今能同时管理多达10个任务 其次,它使用了一项名为“示教与重复”的功能 你只要向它展示一次任务 它就能学会在将来为类似任务做计划 我们将通过Gemini API向开发者提供 Project Mariner的计算机使用能力 Automation Anywhere和UiPath等可信测试方 已经开始使用它构建产品 我们将于今年夏季将其提供给更广泛的用户 为了推动智能体生态系统繁荣发展 我们需要开发更广泛的工具组合 计算机使用能力就是这项工作的一环 这方面的例子有我们的开放智能体间协议 让智能体能够彼此对话 我们在Cloud Next大会上发布了这种协议 获得了60多家技术合作伙伴的支持 这个数字还有望继续增长 还有Anthropic推出的模型上下文协议 让智能体可以访问其他服务 今天,我们要激动万分地宣布 Gemini SDK现已兼容MCP工具 这些技术将协同运作,让智能体更实用 我们已经开始将代理式功能添加到 Chrome、Google搜索和Gemini应用中 我来展示一下Gemini应用中最让我们激动的功能 我们称之为智能体模式 假设你想在奥斯汀给自己和两名室友找间公寓 你们每个人每月的预算是1200美元 希望公寓里有洗衣机、干衣机 或者至少附近要有间洗衣店 通常情况下,你要花很多时间去浏览无数房源 但有了智能体模式,Gemini应用可以为你效力 它在后台访问Zillow等网站 查找符合你的条件的房源 并在需要时使用Project Mariner 调整极其细致的过滤条件 如果有你想具体了解的公寓,Gemini会使用MCP 访问房源,甚至可以帮你安排行程 只要你需要,它就会不断浏览查找新房源 让你可以腾出时间去做自己想做的事情 比如规划乔迁派对 这对Zillow这样的公司特别有用 能够带来新客源并提高转化率 Gemini应用中智能体模式的实验版本 即将面向订阅者开放 这是一个崭露头角的全新领域 我们很激动能亲身探索 如何将智能体的优势带给用户和更广泛的生态系统 要将研究成果落地,我们最好的方案就是 保证它在你的实际环境中拥有真正的实用价值 这正是个性定制的用武之地 为此,我们推出了个人使用场景功能 在征得你的许可之后 Gemini模型可在你的各Google应用之间 使用相关背景信息 并且采用一种保护隐私、高度透明 完全由你掌控的方式 我来展示一个Gmail中的例子 你可能很熟悉我们依托AI技术的智能回复功能 其受欢迎的程度甚至令人有几分意外 如果AI生成的回复能效仿你的口吻,那该有多好 这就是个性化智能回复背后的理念 假设朋友写信给我,向我寻求建议 他打算到犹他州去自驾游,记得我曾自驾去过那里 坦白说,如果我自己写回信 只会寥寥几句带过,帮不上什么忙 抱歉了,Felix 但使用个性化智能回复,我就能成为知心好友 因为Gemini会帮我做好几乎所有的“功课” 查看我云端硬盘中的笔记 查询旧电子邮件中的预订信息 查找Google文档中的行程安排 锡安国家公园之旅 Gemini效仿我既往邮件中的问候语 捕捉到了我的语气、风格和遣词用句的喜好 随后自动生成回复 我最欣赏的是它添加了贴心的细节 比如将驾车时间控制在每天五小时以下 还使用了我最喜欢的形容词:激动人心 看起来不错 或许简单修改几处,就可以点击“发送”了 今年夏天,这项功能就会在Gmail中提供给订阅者 可想而知,覆盖搜索、文档、Gemini 及其他产品的个人使用场景功能会有多实用 今天我谈到了智能、智能体和个性化 这是我们将努力推进的几个前沿领域 在整场主旨演讲中,你会听到更多例子 但首先,我想请一个人 详细分享有关推动我们未来创新的智能 去年在介绍他的时候,我称他为Demis爵士 今年,我们还可以在他的头衔里 加上“诺贝尔奖获得者” Demis,请上台来 大家好!很高兴能再次参加Google I/O大会 我们身处一个重要的历史节点 AI正在开启令人向往的全新未来 这一年,我们在不懈的探索中前行 收获了累累硕果 正如Sundar所说,人们喜欢与Gemini 2.5交互 我们见证了你们用它进行氛围编程 一气呵成开发应用与游戏 见证了你们用它强大的推理能力完成各种任务 从拆解科学论文,到解析YouTube视频 你们告诉我们,Gemini协作性强、洞见深刻, 是真正的得力助手 看到大家用它创造出的惊人成果,我们倍感振奋 Gemini 2.5是我们迄今为止最智能的模型 也是全球先进基础模型 就在两周前,我们发布了升级后的2.5 Pro预览版 让大家可以开始亲手尝试用它将创想化为现实 大家的成果让我们大开眼界 从将草图转化为交互式应用到模拟3D城市 全新的2.5 Pro模型在热门编程排行榜 WebDev Arena上一马当先 现在,它又整合了LearnLM 该系列模型的开发得到了教育专家的支持 这让2.5 Pro也成为全球出色的学习辅助模型 在LMArena的所有排行榜上独占鳌头 Gemini Flash是我们极其高效的王牌模型 因出色的速度和较低的成本备受开发者青睐 今天我要激动地宣布推出更新版的2.5 Flash 新版Flash模型几乎在每一个方面都有所改进 在各类重要基准测试中都取得了更好的成绩 包括推理、编程和长上下文 实际上,它在LMArena排行榜上仅次于2.5 Pro 我要很高兴地告诉大家,Flash将于六月初正式上线 Pro紧随其后 我们正在根据大家的反馈做出最终调整 不过你现在可以在AI Studio Vertex AI和Gemini应用中试用预览版 我们将一如既往,继续不懈前行,推动技术向前发展 并对我们近期的研究突破感到十分欣喜 稍后我会请Tulsee来与大家进一步分享 不过首先,我们来看一下 目前你可以用Gemini来做些什么 [用Gemini可以做的30件事] [物理模拟] [自然模拟] [光学模拟] [谜题模拟] [将图片转变成代码] [将想法转变成3D模型] [为画作加入3D效果] [与AI共同创作] [发型设计] [给这只猫穿上礼服] [在积攒了几十年的文件中搜索内容] [菜谱] [在数小时长的视频中搜索内容] [建造机器人] [直接说话就能编程] 你能做个从我嘴里爆出一团圆形彩纸的特效吗? 我更新了草图 [万物皆可AI:娱乐、学习、动画、可视化] [创造、转录、练习、翻译、查询、表情符号] [混音、计算、探索、理解、地图、解释] [生成千般内容] [构想万种可能] 接下来我们做点什么? 这里还有30个创意供你参考 [使用Gemini开始构建] [AI.Studio] Demis,谢谢你! 很高兴能借此机会告诉大家 为了帮助像你一样的开发者 更轻松地使用Gemini 2.5进行构建 我们根据大家的反馈意见做出了多项改进 其中包括:功能改进、安全性和透明度加强 成本效益提升和可控性提升 首先,除了Demis提到的新版2.5 Flash之外 我们还推出了文字转语音功能的全新预览版 基于原生音频输出提供 同类产品中首创的多讲话人支持 可以支持两个人的语音 这意味着模型可以通过 更富于表现力的方式进行对话交流 能够捕捉我们言语表述之中的微妙之处 甚至能无缝切换到低声耳语,就像这样 它支持超过24种语言 甚至能流畅自如地在不同语言之间切换 模型可以在最初讲英语,然后 [印地语] 然后再切换回来 而且声音丝毫不变 不错吧? 从今天开始,你就可以开始在Gemini API里 使用这种文字转语音功能了 今天稍后,Live API还将提供 2.5 Flash原生音频对话功能的预览版 让你能通过更自然流畅的方式直接与Gemini会话 它甚至能区分讲话人与背景噪音 从而判断合适的回复时机 Logan和Paige将在开发者主旨演讲中分享更多内容 其次 我们加强了针对间接提示注入等安全威胁的防护 让Gemini 2.5成为我们迄今为止最安全的模型 在2.5 Pro和Flash模型中 我们都添加了思考总结功能 可以通过Gemini API和Vertex AI来使用 思考总结功能会提取模型的原始思考过程 将其整理为清晰有序的格式,包含标题、重要细节 以及有关模型操作的信息,比如工具调用 这能让你更清晰地了解模型的思考过程 不但对高延迟任务特别有用,同时方便调试和使用 大家也呼吁提高模型处理效率 而现在,2.5 Flash的效率更胜以往 同等性能的情况下,使用的token更少 在实际测评中效率提升达22% 最后,我们为2.5 Flash引入了思考预算功能 让你能够在成本、延迟和输出质量之间取得平衡 由于大家的反响很好 我们将思考预算功能添加到了2.5 Pro之中 并将在未来几周内随同我们的正式版模型一同发布 借助思考预算功能 你可以更好地掌控模型使用多少token进行思考 然后再给出回答 也可以直接关闭思考功能 之前Demis提到过 Gemini 2.5 Pro有着超强的编码能力 所以接下来,我想展示一下如何将构思落地 如果你参观过纽约市的美国自然历史博物馆 一定记得那里精彩的展品 为了让大家能够看到这些展品 我让2.5 Pro在Google AI Studio中 编写了一个简单的Web应用 用于分享一些照片以及详细信息 这是该应用目前为止的模样 不过我还想进一步加强其互动性 我还在就设计思路集思广益 不过已经有了一些想法 大家都看到过像这样的情况吧? 某人找到你 给你看在餐巾纸上勾勒出的“绝妙”点子 作为PM,我常常就是拿着餐巾纸的这个人 常规的二维网页设计已经不简单 但我想进一步实现三维设计 我知道转为三维并不容易 需要学习许许多多新知识 比如设置场景、相机、光线等 但幸运的是,2.5 Pro可以帮到我 这里我要做的是 把刚才展示的球体图片添加进来 输入提示,让2.5 Pro根据此图片更新我的代码 我们让2.5 Pro开始工作 可以看到,它开始思考 并根据我的要求制定了一份计划 稍后会将其应用于我的原有代码库 Gemini是一种多模态模型 因此能理解这张抽象的球体草图 通过编程生成精美的三维动画 再将其应用于我的原有应用 此过程大概需要两分钟 为节省时间,我们将以类似烘焙节目的形式来展示 我直接切换到另外一个标签页 在这场主旨演讲开始之前,我运行了相同的提示 这就是Gemini生成的结果 我们把一张粗略的草图直接变成了代码 更新了多个文件 而且可以看到,它思考了37秒时间 你也可以看到它的思考变化过程 以及它更新了哪些文件 这一切都是在AI Studio中完成的 所以在完成原型设计之后 我就可以直接用Gemini API密钥部署代码 这是我们的最终版应用在Chrome中的效果 看看这些动画 我不需要有多精深的Three.js库知识 也不必钻研复杂的三维算法,就做成了这样的作品 如果要亲自动手来做,我可能永远也没法实现 但这里,我只用一张草图就做出来了 我可以利用多模态,让整个体验更加丰富 我用2.5 Flash给每张照片添加了一个问题 邀请你进一步了解相关信息 但如果它能说话会怎样呢? 这时我们就可以用到Gemini的原生音频功能 这是一只穿山甲 它的鳞片由角蛋白构成,就像你的指甲一样 哇!现在它支持语音功能了 你可以听到,如何在应用中添加富有表现力的音频 在分享更多内容之前 我想以另一个好玩的设计来结束演示 这也是通过2.5 Pro编码实现的 我们在Google AI Studio提供了起始代码 让大家都可以在本演示的基础上进行二次开发 欢迎大家去尝试 这个演示仅仅是一个例子 证明Gemini 2.5必将大幅改变我们的构建方式 改变你利用非凡的功能 在自己的应用中集成视觉、语音和编码的方式 你可以在自己喜爱的IDE平台 以及各种Google产品中使用2.5 Pro 例如Android Studio、Firebase Studio Gemini Code Assist 以及我们最新的异步编码智能体Jules 你只需提交任务,剩下的就交给Jules来处理 修复bug,执行更新 它与GitHub集成,可以独立运行 Jules能够处理大型代码库中的复杂任务 这些任务过去需要数小时才能完成 比如更新较早版本的Node.js 它能在几分钟内完成规划步骤、修改文件等任务 今天,我很高兴地宣布 Jules将开启公开Beta版测试 所有人都可以通过jules.google注册 正如Demis所说,我们一直在创新优化模型的方法 包括提高模型的效率和性能 我们率先采用扩散技术,革新了图像和视频的生成 扩散模型可通过逐步优化噪声来生成输出 现在,我们正借助最新研究模型将扩散应用于文本 这样有助于提升处理编辑等任务的能力 包括在数学和编码等应用场景中 因为它不只是从左到右线性生成内容 还能够快速反复试验解决方案 并在生成过程中不断纠错 Gemini Diffusion是一种领先的文本扩散实验模型 利用并行生成技术,实现超低延迟 例如,我们今天发布的Gemini Diffusion版本 生成速度是我们目前速度最快的模型 2.0 Flash-Lite的五倍 而编码能力却旗鼓相当 以这个数学问题为例 准备,开始! 眨眼间整个过程就完成了 之前我们加快了速度,但这次我们会放慢一点 看到模型如何一步步计算出39这个答案,感觉很棒 此模型目前正在小范围测试 我们会继续探索各种方法 降低所有Gemini模型的延迟 并即将推出速度更快的2.5 Flash-Lite模型 更多有关Gemini未来发展的信息 请Demis与大家进一步分享 谢谢你,Tulsi 我们一直在不懈探索Gemini 2.5思考功能的边界 使用AlphaGo的经验告诉我们 给模型更多思考时间,其回答质量会得到改善 如今,我们进一步优化了2.5 Pro 引入了名为Deep Think的新模式 它能将模型性能发挥到极致,带来突破性的成果 Deep Think采用了思考与推理领域的前沿研究 包括平行技术 目前为止,我们看到的性能堪称惊艳 在目前难度最高的数学基准测试USAMO 2025中 它的评分十分亮眼 在LiveCodeBench中也处于领先水平 这是一项针对竞赛级编码的高难度基准测试 Gemini从一开始就具备原生多模态能力 所以自然在衡量此能力的主要基准中表现同样出色 这一基准是:MMMU 因为我们正在通过2.5 Pro Deep Think来引领前沿技术 我们需要额外花一些时间来进行更多前沿安全评估 并从安全专家那里获取更多意见 因此,我们将通过Gemini API 向可信测试员开放此功能 以便在大规模推出此功能前获取反馈意见 今天稍后,Josh会更详细地给大家介绍 我们针对2.5 Pro Deep Think的计划 过去十年 我们为现代AI纪元的到来做了很多基础工作 从我们开创性地发明了Transformer架构 它如今已成为所有大语言模型的基础 到打造AlphaGo和AlphaZero等智能体系统 我们将继续拓展基础研究的深度和广度 探索下一个重大突破 满足人们对通用人工智能的需要 Gemini如今已是卓尔不凡的多模态基础模型 但我们依然脚步未停 竭力将其打造成所谓的“世界模型” 待到那时,它将能够通过模拟世界的方方面面 制定计划和构想全新体验,就像人类的大脑一样 这一直是我个人的热情所在 早在我为《主题公园》等模拟游戏 开发AI的早期职业生涯中 我就已经开始探索虚拟世界 多年来,我们一直向这个方向迈进 从训练智能体掌握围棋和《星际争霸》等复杂游戏 到最近推出的Genie 2模型 它仅通过一张图片作为提示 就能生成可交互的三维模拟环境 大家已经可以看到这些功能正在逐渐显现 例如Gemini能够运用对世界的认知和推理能力 来呈现自然万物 还有我们先进的视频模型Veo 它对基本物理规律有着深刻理解 比如重力、光线和材料的属性 Veo令人惊叹的地方在于 它能在所有帧中保持高度的准确性和连贯性 即使提示脑洞大开,它也知道该怎么做 比如这个用救生筏生成的人 理解物理环境对于机器人技术也至关重要 AI系统需要具备世界模型 才能在现实世界中高效地运作 我们微调了一个专用模型,Gemini Robotics 它可以教机器人完成各种实用任务 例如抓取物体、执行指令和动态适应新的任务 在场的各位,可以在AI展示区中体验这些机器人 将Gemini打造成完善的世界模型 对于解锁新型AI至关重要 比如能够为日常生活提供帮助的AI 智能且理解你所处情境的AI 以及能够跨设备为你制定计划并采取行动的AI 我们对Gemini应用的终极愿景 就是将其打造成一个通用型的AI助理 让它成为富有个性、主动思考、功能强大的AI 以及我们迈向通用人工智能的重要里程碑 这要从我们去年在Project Astra中 首次探索的功能开始 包括视频理解、屏幕共享和记忆等功能 过去一年,我们一直在将这些功能引入Gemini Live 以便更多人今天就能体验到 当然,我们也会不断改进,并探索新的前沿创新 比如通过原生音频升级语音输出,使其变得更自然 我们改进了记忆功能,并增加了计算机控件 我们来看一下 我现在向大家展示的是 Project Astra的最新研究原型 下面来看看它如何帮我修自行车 [Project Astra] [行动智能+Gemini] 上网查查Huffy山地自行车的用户手册 已找到一份用户手册 你想要什么信息? 好,现在向下滚动页面,找到刹车系统的相关章节 好的,正在为你查找相应页面 这颗螺丝可能滑牙了 能否上YouTube找个修复教程视频? 没问题,正在打开YouTube 这个视频看起来不错 将橡皮筋套在螺丝头上 噢,不错,谢谢 查下我跟自行车店的往来邮件 看看我需要哪种规格的六角螺母? 好的,Bicycle Habitat的邮件显示 你的链轮需要一个3/8英寸的内六角螺母 我已经帮你标出了相应的工具盒 我好像需要一个备用的张力螺丝 能否联系最近的五金店确认是否有货? 好的,正在联系对方 稍后我会告诉你具体库存信息 我的刹车片有磨损了 麻烦再查一下用户手册 看看上面有没有提到刹车片? 用户手册的第24页显示 要去吃午饭吗? 好,再等我五分钟 你刚才说到哪了? 刚才说到,第24页第2节有相关说明 介绍了如何更换刹车片 之前说的那个电话有进展了吗? 嗯,我刚和五金店通完电话 他们确认张力螺丝还有库存 要我下一个自取订单吗? 能否展示几款适合我的自行车用的狗篮? 没问题,乐意效劳,稍等片刻 看看这几款怎么样 我觉得特别适合Zuco [行动智能+Gemini] [电脑控制/重点标示/通话助理/知识接地 原生音频/主动思考/聚焦讲话人/个性化购物] 通用AI助理将帮助我们处理各种任务 它会处理琐碎的行政工作 并给出令人愉快的新推荐 从而提高我们的效率,丰富我们的生活 我们正向可信测试员收集这些新功能的反馈意见 并致力于将它们引入Gemini Live 提供新的搜索体验 以及面向开发者的Live API 还有Android XR眼镜等全新形态的设备 今天后面还会有更详细的介绍 在我整个职业生涯中 核心都是关于如何利用AI来推动知识进步 以及加速科学发现 Google DeepMind长期以来都在致力于 将AI应用于近乎每个科学领域 仅在过去一年 我们就已经在多个领域取得了巨大突破 包括数学、生命科学等领域 我们构建了AlphaProof 它可以解决奥林匹克数学竞赛中银牌水平的问题 Co-Scientist,它可以与研究人员协作 帮助他们开发和测试新的假设 我们还刚发布了AlphaEvolve 它可以发现新的科学知识,并加速AI本身的训练 在生命科学领域,我们构建了AMIE 一个可以帮助临床医生进行医疗诊断的研究系统 AlphaFold 3 能够预测所有生命体的分子结构和相互作用 以及Isomorphic Labs,它以AlphaFold为基础 致力于用AI来革新药物研发流程 未来有望帮助攻克多种全球性疾病 短短几年时间 AlphaFold就已经在科学界产生了深远影响 它已成为生物学及医学研究的标配工具 全球超过250万的研究人员 正在其关键工作中使用这一工具 在发展通用人工智能的道路上 我始终坚信,如果以安全和负责任的方式进行 AI有望加速科学发现进程 并成为有史以来最有益的技术 回想起来,真是不可思议,就在几年前 大家今天看到的这些尖端技术还跟魔法一样 看到这些技术为搜索和Gemini等产品的新体验赋能 并且共同在日常生活中帮助人们,真是令人兴奋 例如,我们最近与Aira建立了合作关系 这家公司帮助盲人和低视力人群探索世界 方法是将该人群通过视频 与人工“视觉翻译”连接起来 利用Astra技术 我们设计了一个帮助更多人获得此类协助的原型 我们正在持续收集用户反馈 同时Aira的翻译人员也在积极监督安全性及可靠性 凭借这项技术以及我们所有的开创性工作 我们正在打造更具个性、更主动、更强大的AI 从而丰富我们的生活、加速科学进程 并开启一个充满发现和奇迹的黄金时代 我记得我小时候经常弹吉他到天黑 来证明即使我看不见,也可以弹吉他 我在大概四岁左右被诊断出患有视网膜色素变性症 我的视力水平不断恶化 但面对视力逐渐模糊的现实 音乐便是我的解药 玩音乐让我倍感自由 如果Project Astra能助我更独立地生活 那真是再好不过了 就拿旅游来说,我非常喜欢旅游 因为可以走出去,去从未到过的地方,结识新朋友 但这确实变得越来越困难 你好 嗨,我来拍摄周围环境 你能告诉我这个绿色房间里有什么吗? 你面向的墙壁上贴有一个指示牌 写着“Wi-Fi network: TheGreyEagle” 密码是“livemusic” 非常感谢。你能告诉我麦克风架在哪儿吗? 没问题,非常乐意为你提供帮助 我可以打开你的手电筒吗? 当然可以 这面墙上有一些盘绕的电缆 视频右上方位置应该就是麦克风架 我能做的最有力量的事就是登上舞台 拿起吉他,尽情演奏 让人们意识到,看不看得见 残疾与否,并不能决定一切 如果Project Astra能助我一臂之力 我将全力支持它 祝你演出愉快 [前往goo.gle/AstraVI注册加入视觉翻译等候名单] 谢谢你,Demis Project Astra在无障碍功能方面的潜力让人惊艳 这又是一个激动人心的例子 说明AI可以推动我们一直以来的使命 即:整理全球信息,让所有人都能访问并从中受益 要说最能体现我们使命的产品,非Google搜索莫属 正是因为搜索,我们几十年前就开始投资AI 也正是通过搜索,我们得以将AI的益处惠及大众 满足人类好奇心 Gemini模型正在让Google搜索 变得更智能、更真实、更个性化 我们取得了不俗的进步 AI概览就是一个绝佳的例证 自去年I/O大会推出以来 该功能已覆盖200多个国家/地区 每月服务超15亿用户 随着人们使用AI概览 我们发现他们对搜索结果更满意 并且搜索频率更高 在我们的主要市场,如美国、印度 在AI概览的推动下,查询类型 实现了超过10%的增长 最令人振奋的是,这种增长势头与日俱增 这是搜索领域过去十年最成功的产品之一 AI概览也是推动Google智能镜头 视觉搜索增长的最强劲动力之一 智能镜头的搜索量同比增长65% 今年已有超千亿次视觉搜索 在我们最新的Gemini模型发布后 不仅用户查询量显著增加 而且他们还在尝试更为复杂的查询 AI概览达到了用户期待的 搜索质量与准确程度 并拥有行业领先的响应速度 为满足端到端AI搜索体验需求 我们正推出全新AI模式 这是对搜索的全面重构 同时搭配更先进的推理能力 你可以向AI模式提出更长、更复杂的查询 就像这样 实际上,用户查询长度已是传统搜索的2到3倍 而且我们支持多轮追问 所有这些今天正式上线 将作为新标签页整合到搜索中 我个人高频使用后发现 它彻底改变了我的搜索方式 很高兴宣布AI模式今日起 面向全美用户开放 AI模式将率先为Google搜索 引入我们的前沿技术 本周起,我们最智能的模型系列Gemini 2.5 将接入Google搜索 带来更丰富的功能 接下来有请Liz Sundar,谢谢 短短一年时间 用户使用Google搜索的方式就发生了巨大变化 以前,用户在Google上搜索时 常常会问这样的问题 但现在,用户的问题变成了这样 用户的问题更长,也更复杂了 正如Sundar刚才所说,问题数量也大大增加了 用户正在亲身体验AI赋能的搜索 我们将Gemini模型的先进功能 与Google搜索对网络和世界信息的深刻理解 结合在一起 现在,你会发现你可以提出任何问题 更智能、更个性化的代理式搜索功能 将可以处理你最棘手的问题 并帮助你完成任务 这就是Google搜索的未来 它将超越信息本身,变得越来越智能 大家已经开始看到AI概览将这一切变为现实 而AI模式更是将它们提升到了新高度 AI模式是以Gemini 2.5为核心的变革性搜索体验 它是我们功能最强大的AI搜索 能够应对任何问题 正如Sundar所说 从今天开始 我们将在美国全面推出AI模式 它会以新标签页的形式直接出现在搜索页面中 大家也可以从搜索栏进入AI模式 AI模式将带来我们最精华的AI功能 但还不止于此 从它可窥见未来的广阔前景 未来,我们将逐步推出大量AI模型、先进的功能 并会直接整合到核心搜索体验中 今天就是起点 我们带来了为AI模式和AI概览提供支持的模型 大家在搜索框中就可以直接提出最难的问题 今天,我们将带大家全面了解AI模式 看看它如何运作,如何变得越来越强大 尤其是在个人使用场景 深度研究、复杂分析、可视化 实时多模态以及购物新方式等方面 亮点很多,因为AI模式的功能很强大 下面,我们具体来说一下 首先,使用AI模式,你可以随心所欲地提问 大家可以看到,搜索功能会立即开始工作 生成回答,将所有信息整合在一起 包括你可能从未发现的内容和创作者的链接 以及包含评分等实用信息的商家和企业的链接 Google搜索使用AI动态地调整整个界面 灵活组合文字、图片、链接,甚至是地图 只为更好地回答你的问题 你可以追问,就像跟人对话一样 现在,AI模式不仅仅是提供信息 更将搜索带到了全新的智能水平 这一切之所以能实现 得益于称之为查询扇出的技术 其原理是 Google搜索会识别需要高级推理的问题 并调用定制版的Gemini 将问题分解为若干子主题 然后替你同时发起大量查询 它会在整个网络进行搜索,深度远超传统搜索 它还会利用我们所有的实时信息数据集 例如知识图谱、购物信息图谱 以及本例中涉及的本地数据 这其中包含地图社区中,5亿多贡献者的数据洞见 Google搜索会整合所有信息给出回答 并进行自我检查 确保符合我们对信息质量的高标准要求 如果发现任何不足,它会发起更多搜索来弥补 这意味着,在AI模式下 你只需搜索一次,就能快速获得所有这些信息 现在来看看AI模式即将增加的新功能 这些功能会先在实验室中进行测试 不久之后,AI模式将能根据你以往的搜索记录 提供个性化的建议,从而使回答更具针对性 你还可以选择关联其他的Google应用 首先是Gmail 我们称之为个人使用场景 关联之后 AI模式可以引入你的个人使用场景来提供帮助 现在,根据你最近的酒店预订和搜索记录 它能推断出你更喜欢户外的座位 由于你订阅了这些画廊简报 它就会推荐一些精彩的艺术展 方便你在当地停留期间参观 但还不止这些 如果你的航班和酒店确认邮件都在收件箱里 它还会推荐你在纳什维尔时刚好能参加的活动 推荐你在停留期间的周边好去处 你会发现,AI模式中的个人使用场景功能 可以将Google搜索变成为你量身定制的工具 专门为你提供推荐内容 这一切始终都由你掌控 你可以随时选择关联或解除关联 个人使用场景将于今年夏天在AI模式中上线 另外,我们将针对需要更深入解答的问题 为AI模式引入Deep Research功能 大家已经在使用Google搜索来剖析某个主题 而这项功能将研究的深度和广度又提升了一个级别 所以我们称之为Deep Search Deep Search同样采用前面提到的查询扇出技术 但功能更强 它可以替你发起数十次甚至数百次搜索 它会对所有分散的信息进行分析推理 并在几分钟内生成一份 带有完整引用信息的专家级报告 报告中会包含网页链接 方便你进一步探索和采取行动 这是我们构建AI模式的核心理念 以及我们对搜索领域中AI运用的一贯思考 因为我们坚信,AI将成为Web有史以来 最强大的发现引擎 帮助人们发现网络中更多有价值的信息 找到令人惊叹且高度相关的内容 大家已经开始感受到搜索变得越来越智能 但精彩远不止于此 接下来,我把时间交给Rajan 他将介绍AI模式如何帮助他分析 他热爱的一个体育领域里的复杂数据 Liz,谢谢你!我是一个狂热的棒球迷 最近关于这种叫做“鱼雷球棒”的新型球棒 引起了很多讨论 为不太关注棒球的朋友解释一下 这是一种新型球棒 它的特点是将更多重量集中在最佳击球点 正如大家所见 我一直在研究这种球棒是否真的对比赛产生了影响 现在,我想知道数据会怎么说 于是,我向Google搜索提出了一个问题 请显示目前使用鱼雷球棒的知名球员 在本赛季和上赛季的打击率和上垒率 这个问题并不简单,包含了多重维度 Google搜索需要识别哪些是知名球员 谁在使用鱼雷球棒,并整合他们的赛季数据 但它马上给出了非常实用的回答 其中还有容易理解的表格 而且,数据新鲜、精准 因为它使用的是我们持续更新的体育数据 甚至精确到最近一次好球 Google搜索甚至还提供了重要的背景信息 比如“目前赛季仍处于早期阶段” 我继续追问:这些球员本赛季击出多少支本垒打? 瞬间就获得了一张图表 这正好印证了Liz刚才提到的 AI模式能够为每个回答动态生成合适的界面 Google搜索确定 最适合呈现这些信息的方式是图表 因此生成了图表 就像Google搜索里内置了一个专属体育分析师 针对体育和金融问题的复杂数据分析和可视化功能 将在今年夏天上线 说了这么多棒球,我都想去现场看比赛了 比如说,下一场就去看 但是,购买好票总是让人头大 这里很高兴地告诉大家 我们正将Project Mariner的代理式功能 整合到AI模式中 大家已经看到AI模式正变得更加智能和个性化 现在可以开始看到Google搜索正变得更加主动 它能帮我完成任务,但仍由我保持掌控权 我会告诉它 “找两张这周六红人队比赛下层看台的平价门票” Google搜索启动查询扇出 同时扫描多个网站,分析上百个潜在的门票选项 按我提出的所有条件填写表单 不用我去做这些繁琐的工作 然后将所有信息汇总在一起 基于搜索结果进行推理,分析实时票价和库存 然后,像这样,任务就完成了 它给出了不错的门票选项,还有实用的背景信息 我可以在此基础上做出明智的决定 这些座位看起来视野良好,价格合理 Google搜索已代我完成了大量步骤填写这些信息 并提供了链接,引导我完成结账 定下这些门票 Google搜索很快将能够帮助处理这类任务 首先覆盖的是活动门票、餐厅预订和本地生活服务预约 接下来,让我们聊聊多模态技术 从多模态搜索这个概念还不怎么流行的时候 我们就一直是这个领域的方向引领者 回到2017年,我们就是在这个讲台上 宣布推出了Google智能镜头 此后我们不断优化,让所见即所搜更加便捷 只需用Google智能镜头拍照或使用圈定即搜 就能立即获得AI概览 Sundar刚才提到过 视觉搜索目前正呈现出燎原之势 今天我很激动地宣布 每月有超过15亿用户使用Google智能镜头 现在,我们正围绕多模态迈出重大的一步 将Project Astra的实时功能引入AI模式 想想那些对话交流一下,就会变得超级简单的问题 而且自己的意图还能得到准确的展示 比如家庭DIY维修 棘手的学校作业,或是学习新技能 我们称之为实时搜索 现在利用摄像头 Google搜索能随着用户来回走动 实时感知他们看到的画面,并提供有用信息 就像在与Google搜索进行视频通话 我有三个孩子,他们每分钟能问上百万个问题 随着暑假临近 我和团队决定对实时搜索进行终极测试 帮助我们和孩子们解决些新问题 上周末,我们与我的家人在家里录制了演示 一起看下吧 看起来你们准备做有趣的科学实验 好的。准备好了吗? -好了 -好的 -你准备好开始实验了吗? -好了 能猜出我要做什么实验吗?我有双氧水 洗洁精和酵母 你可能要做大象牙膏实验 我知道哪颗草莓可以吃了 我在想办法让遥控器工作 看来有人准备种下青豆幼苗 把压力调到每平方英寸50磅左右 但不要超过每平方英寸90磅 我混合了小苏打,接下来做什么? 看起来有人把手指伸进肉桂水里了 如何让实验更壮观? 可以尝试不同的催化剂 碘化钾是个好选择 哇!为什么会这样? 成熟的草莓也会有甜香味 顶部绿叶应新鲜、有活力 化学反应进行得很顺利 -太棒了!谢谢! -再来一次可以吗? 小伙子,怎么洗掉衣服上的草莓渍? 尝试用一汤匙白醋 加半茶匙洗衣液 通过AI模式 我们正在带来全新Google智能购物体验 前面提到过 AI模式整合了网络信息和实时数据 在这种情况下 这意味着既可通过Google图片获得视觉灵感 又能获得购物信息图谱提供的 海量商品和零售商数据 其中包含超过500亿条持续更新的商品详情 我来演示一下这是如何实现的 我一直在为我的客厅寻找一块新地毯 因此,我给出提示:我家有一个浅灰色的沙发 想找一块能让房间看起来更明亮的地毯 我首先需要的是视觉灵感 Google搜索根据我的喜好 动态生成了一个可浏览的图片拼接图 并显示了一些可购买的商品 其中就有我常用品牌的地毯 以及风格更现代的选项 因为我经常搜索这类风格的物品 这些推荐虽好,但大多数在我家恐怕连一天都撑不过 于是我补充道 家里有四个活泼的孩子,他们经常带朋友来玩 Google搜索立刻意识到了那种杂乱的场面 于是推荐了采用耐用材质的短绒地毯或可水洗地毯 还附上了一些可直接购买的产品 不过我对地毯并不专业 好在Google搜索贴心地指出了需要考虑的事项 并提供了后续实用建议 原本需要几周的研究,现在只需几分钟 可以想象,这种全新的AI模式体验 对购物需求会有多实用 说到购物,我需要几件夏天穿的新裙子 Google搜索给了我一些不错的选择 但现在我遇到了经典网购难题 那就是完全不知道这些款式穿在我身上会是什么样 于是,我们将推出一项新的试穿功能 帮用户虚拟试穿 感受款式在身上的效果 我来实时演示一下 在一通搜索之后,我找到一条喜欢的蓝裙子 然后点击这个按钮试穿 系统提示我上传照片,并引导我进入相册 我有很多照片 于是打算选一张清晰的全身照 处理就开始了 在等待系统处理的时候 我想介绍下背后的技术原理 为了打造这种规模化运作的试穿功能 我们需要深度理解人体结构 及服装在人体上的呈现效果 为此,我们构建了一个专门针对时尚行业训练的 定制图片生成模型 哇,处理完成了! 必须说实时演示成功的感觉太棒了 我们来继续聊背后的原理 该技术整合了先进的3D形体理解能力 能更精准地感知形状与深度 从而更好地呈现人体轮廓 这种体验完全基于你的照片 而非预先拍摄的图片或跟你不像的模特 对于你心仪的服饰 AI模型能够呈现面料褶皱、延展和垂坠感 这是一项业内领先的技术,可大规模应用 借助它,我们能以直观的方式 呈现数十亿服装产品 在不同体型的人群身上的穿着效果 大家可以看到 这个功能让我真实感受到了裙子上身的效果 选好裙子后 Google搜索还能通过全新代理式结账功能 按目标价位帮我购买 现在回到这件裙子的页面 我想点击按钮,跟踪价格 选择尺码后 设定目标价 格 我打算设成50美元左右 跟踪功能马上启动 Google搜索现在将持续监测销售该裙子的网站 在价格降到位时通知我 现在我们退出实时演示 这里我施展一点魔法 假设价格现在降到位了 此时系统会推送类似画面中的通知 我确认购买后 结账智能体会将尺码和颜色合适的裙子 添加到购物车中 我可以选择核对所有支付与配送信息 或直接授权智能体完成购买 只需点按一下,Google搜索就能 使用Google Pay安全地代我完成购买 当然,从灵感激发到最终购买 整个流程全程由我主导 我们的全新智能功能 将最好的购物体验与顶尖AI技术 融合在了Google搜索中 全新可视化购物及结账功能 将在未来几个月内逐步推出 虚拟试穿功能即日起可在实验室版本中体验 现在把时间交还给Liz 感谢Vidhya!正如Sundar所说 本周晚些时候即将迎来重大升级 Gemini 2.5定制版将集成到AI模式和AI概览中 这意味着,Google搜索迎来了新篇章 受益于此,AI概览将会把AI的实用性 带给核心Google搜索体验的每一个用户 正如你今天所见 AI模式是一种彻底重构的AI搜索 集成了我们最前沿的AI特性和功能 我们很激动,Google搜索迎来了新篇章 毫不夸张地说,用户可以真正地问它任何事 从最简单到最棘手的问题 最深的研究、个性化购物需求 希望代劳的琐事 只需提问,即可获得响应 好戏开场!我的魅力自然流露 我的风格如此惊艳,让所有人都为之震撼 等等!我感觉妙不可言 来吧,展示你如何舞动 舞动、舞动,释放自我 我用崭新视角迎接挑战 将热情点燃,让全场沸腾 我们将激情调到最高点,就是这样,来吧! 舞动、舞动,释放精彩 来吧,尽情展现你的独特魅力 我还应该做些什么来让它更坚固? 为了让它更坚固 建议在设计中运用更多三角形结构 已经足够完美了 尽情沐浴在聚光灯下,因为你值得闪耀 F-A-B-U-L-O-U-S,每一天都光芒四射 想要就来追求,勇敢出击 无意冒犯,只为精彩舞动 舞动、舞动,释放精彩 我带来崭新的创意风格 将热情点燃,让全场沸腾 我们把热情推向极致 就是这样,舞动、舞动,释放精彩 来吧,尽情展现你的独特魅力,让我大声喊出 就是这样,太棒了! 舞动、舞动,释放精彩 我带来崭新的创意风格 将热情点燃,让全场沸腾 我们把热情推向极致 来吧,舞动、舞动,释放精彩 来吧,尽情展现你的独特魅力,光芒四射! 每一天都耀眼夺目 想要就来追求,勇敢出击 无意冒犯,只为精彩——等等! 多年来,人们一直致力于构建 一种不仅能给出回应,而且具有理解能力的AI助理 一个不仅仅等待用户提问,而是能够提前预判需求的助理 一个真正能为用户赋能的通用助理 今天,我们正朝着这个方向迈出新步伐 而Gemini应用正是我们实现这一目标的工具 我们的目标是将Gemini打造成 最个性化、最主动、最强大的AI助理 而这一切始于个性化 如果你的AI助理真正属于你 完全为你定制,会怎样? 它能学习你的特点、你的偏好 你的项目、你的生活场景 而你始终处于主导地位 在你授权的情况下 你可以与它分享你所有的Google信息 使其成为你的延伸 我们将这项功能称为“个人使用场景” 我们已经实现了让用户与Gemini分享搜索记录 这样它就能知道用户曾经搜索过哪些食谱 并据此生成这样的回答 很快,你还可以添加 你在各种Google服务中的更多个人使用场景 让Gemini为你提供专属帮助 如果你选择启用这个功能 将始终掌控自己的体验 启用后,你可以随时查看和管理自己的信息 关联或解除关联各种Google应用 这种个性化将孕育主动型AI助理 带来革命性改变 要知道,目前大多数AI都是被动反应式的 你问一句,它答一句 但如果它能预见即将发生的事情 在你问它之前就帮你做好准备呢? 假设你是一名学生 你的物理考试即将来临 Gemini能提前一周在你的日历上圈出这场考试 而不是让你手忙脚乱地准备 它并不只是提醒你而已 它会为你提供个性化测验 这些测验整合了你的课堂材料 教授的讲义,甚至是你手写笔记的照片 这不仅仅是有用 这会让人感觉就像魔法一样神奇 再更进一步 设想Gemini能够基于你的兴趣 制作个性化讲解视频 帮助你更好地理解学习主题 例如,Gemini了解到我喜欢骑行 它就会用自行车相关的类比来为我讲解热力学原理 这就是Gemini的发展方向 而这一切之所以成为可能 都要归功于底层模型的强大能力 上个月,我们发布了最新的Gemini 2.5 Pro模型 这不只是一次升级,而是一次飞跃 人们正在用它创造出非凡的成果 他们不仅仅是进行氛围编程 而是能在几分钟内创造出 完整的游戏和功能齐全的网站 他们只需要在脑海中构思,就能让创意变为现实 而且这很有趣,无论是第一次编写软件 还是使用Veo模型创建视频,或者生成和编辑图像 这些技能现在成了每个人都能掌握的“超能力” 因此,个性化、主动性、强大功能 这三个方面是AI辅助的前沿领域 而借助Gemini 2.5 Pro 我们在这三个方面都取得了重大进展 接下来,我们来详细了解一下 这些功能如何在Gemini应用中实现 我们今天将推出五项新功能 首先,我们来看看Gemini Live 许多用户对其自然流畅的交互和对话方式赞不绝口 它支持150多个国家/地区的45种以上的语言 它是如此直观、如此富有互动性 以至于用户与它的对话时长 是Gemini应用中文本对话的五倍 从我的个人经验来说 它非常适合在早上开车上班的路上 交流讨论、梳理思路 正如Sundar提到的 Gemini Live现在增加了 出色的相机和屏幕共享功能 而从今天起 你可以在Gemini移动应用中免费使用这些功能 并同时支持Android和iOS设备 在接下来的几周内 你将能够把Gemini Live连接到你喜爱的部分应用中 如日历、地图、Keep和Tasks 这样一来,你只需将摄像头对准邀请内容 就能让Gemini立即将其添加到日历中 或者,在面对室友手写的潦草购物清单时 Gemini Live能够将那些潦草的笔记 转换成Google Keep中的整洁列表 我们为Gemini Live规划了众多令人期待的新功能 这些功能正在刚才展示的Project Astra中进行原型设计 当这些功能成熟后 我们会在Gemini Live中推出,让所有人都能使用 由于Gemini和Android合作紧密 这些创新功能中的大部分 会在整个生态系统中的Android设备上大放异彩 所以,敬请期待未来的更多更新! 实时交互确实很棒,但有时候,你需要深入挖掘 梳理一些复杂的内容 这就是Deep Research的用武之地 从今天起,你可以在使用Deep Research时 上传自己的文件来指导研究智能体 这也是用户呼声最高的一项功能 很快,你还能够将Deep Research 与Google云端硬盘和Gmail连接 以便轻松地从中导入信息 假如你获得了一份精彩、翔实的研究报告 比如这份关于彗星在太空中运行轨迹的科学分析 但要如何才能让它变得易于理解又能吸引读者呢? 以及如何分享这些精彩内容呢? 这就是Canvas大显身手的时刻 Canvas是Gemini提供的交互式协同创作空间 现在借助Canvas 只需轻轻一点就能转换报告格式 你可以将它转换成动态网页、信息图、实用测验 甚至是支持45种语言的自定义播客 要想更进一步,你可以在Canvas中通过氛围编程 创建各种精彩内容,让它按照你的想法不断完善作品 直到创造出你脑海中的构想 例如,我们的一位Google同事 仅仅是描述了自己的构想,然后与Gemini展开协作 便创造出了这个精确的交互式彗星运行模拟 现在,你也可以分享这样的应用 让其他人也能一起查看、修改甚至二次创作 这种能够转化任何内容的能力 开创了使用Gemini的全新方式 今天,我们还将推出Gemini的另一种全新使用方式 Chrome中的Gemini 它将成为你在桌面端浏览网页时的AI助理 最棒的是 它能直接理解你当前浏览的页面内容 只要你想到任何问题,都能获得针对性的解答 我个人最喜欢用它来对比一长串的评价内容 比如这个露营网站 从本周开始 我们将向美国地区的Gemini订阅者 推出Chrome中的Gemini 至此,我们已经体验了测验、Gemini Live对话 学习了彗星和露营地的知识 现在,我们来创造一些内容 从今天起 Google旗下最先进、功能最强大的图像生成模型 正式在Gemini应用上推出 它叫做Imagen 4,这是又一次重大飞跃 生成的图像更加饱满,色彩更加细腻,细节更为精细 例如各种场景中的阴影层次 以及照片中栩栩如生的水滴效果 经过长期的研究 我可以肯定地说,这些模型生成的图像质量 已经实现了从“不错”到“出色”再到“惊艳”的飞跃 Imagen 4在文字和排版方面也有很大提升 之前的模型虽然能生成不错的图像 但在图像中加入文字时总会出现瑕疵 举个例子,假设我想创建一张音乐节海报 将那只Chrome恐龙作为主角 Imagen 4不仅能够准确呈现文本内容和正确拼写 它还能做出富有创意的设计决策 比如在字体中融入恐龙骨骼元素 调整文字间距、字号大小和整体布局 创造出这张很棒的海报 总之,图像质量更高、生成速度更快、文字效果更好 这样一来,你就可以制作海报、派对邀请函等内容 借助原生图像生成功能 你还可以直接在应用中轻松编辑这些图像 我们还开发了一个快速版本的Imagen 4 我们非常期待你能亲自体验它 它的速度是我们先前模型的十倍 让你能够快速尝试和完善各种创意 最后,我想向大家展示一项新内容 这些生成的图像的确很棒 但要讲述一个完整的故事有时需要动作和声音的配合 去年12月,我们发布的Veo 2模型 重新定义了整个行业的视频生成标准 如果你注意到了Demis昨天发布的煎炒洋葱视频 就能猜到我们还有更多新鲜出炉的惊喜 今天,我很高兴地宣布推出我们最先进的模型 Veo 3 与今天发布的其他内容一样 它从今天起就已开放使用 视觉质量更加出色 对物理规律的理解更加强大 但这次质的飞跃在于,Veo 3实现了原生音频生成 这意味着Veo 3能够生成音效 背景音,甚至对话 只需输入提示,你的角色就会开口说话 这是森林中一只睿智的老猫头鹰与一只紧张的小獾 敬请聆听 他们今天留下了一个球 它能弹得比我跳得还高! 这是什么神奇的魔法? 很酷吧?Veo不仅添加了森林的声音 还添加了对话 内容创作正在进入结合音频和视频生成的新时代 无论是画面还是声音都栩栩如生 让人感觉身临其境 在这个视频中,就像真的坐在这艘船上 这片海洋,是一股无与伦比的力量 一种未被驯服的野性力量 她指挥着你的每一次划桨 伴随着每一道破浪的闪光 如此逼真的画面、丰富的情感表达 匹配的口型,以及背景中的海洋 作为一款强大的创意工具 Veo的发展速度令人叹为观止 我们一直在与电影行业密切合作 共同探索Veo的可能性,直至做好发布的准备 稍后也将为大家分享更多具体内容 以上就是Gemini的更新内容 从今天起,Gemini Live的各项功能 在Android和iOS上完全免费提供 Deep Research和Canvas迎来了迄今为止最大的更新 正如之前介绍的 支持多步骤操作的Agent Mode也即将推出 我们推出了Chrome中的Gemini,帮助你浏览网页 你可以使用全新的Imagen 4和Veo 3模型 创建令人惊叹的图像和音画结合的视频 所有这些功能都将在Gemini应用中整合 助力我们打造最个性化、最主动、最强大的AI助理 接下来,Jason将为大家详细介绍 这些生成模型如何为创意表达开启全新可能 有请Jason 谢谢,Josh 无论你是创作者、音乐人还是电影制作人 生成式媒体技术正在拓展创意表达的可能性 通过与艺术家和创作者一直以来的密切合作 我们开发了能够赋能其创作过程的技术 例如,我们与音乐人合作开发了Music AI Sandbox 这是一款专为音乐专业人士设计的工具 让他们能够在创作过程中 探索我们的音乐生成模型Lyria所带来的可能性 例如这段视频记录了音乐传奇人物、格莱美获奖歌手 作曲家Shankar Mahadevan 使用Music AI Sandbox和Lyria的场景 我是Shankar Mahadevan 一名音乐作曲家、歌手、制作人 大家都说我笑口常开 使用Sandbox的体验非常棒 我们输入需求后,它生成了一段背景音乐 我们在此基础上创作出了完整的歌曲 对一名音乐人而言,这是一个极具启发性的工具 就像你打开一扇门,发现了另一个空间 然后再开一扇门,发现更多可能性 AI就是这样,不断开启新视野 太棒了 我们最近推出的Lyria 2模型 可以生成高保真音乐和专业级音频 它生成的音乐旋律优美动听 还能编入独唱和合唱人声部分 它能够创作出富有表现力且层次丰富的内容 例如接下来的这段音乐 Lyria 2从今天起正式向企业用户 和YouTube创作者和专业音乐人开放 这种协作理念不仅体现在我们构建的产品中 也体现在我们的构建方式上 目前,无论是个人还是组织 都难以有效识别AI生成的图像 随着技术的进步和生成的音乐 音频、图像、视频日益逼真 这一情况只会更加泛滥 因此,我们在这一领域持续创新 两年前,我们开创了SynthID技术 它能在生成的媒体内容中嵌入不可见的水印 到目前为止,已有超过100亿生成的内容带有水印 另外,我们也在进一步扩大合作伙伴关系 确保更多内容带有SynthID水印 同时让更多组织能够检测到水印 最后,我们还简化了水印的检测机制 我们新推出的SynthID检测器能够识别 图像、音频、文本或视频是否含有SynthID水印 即使只是部分内容被标记也能识别 这一功能从今天起开始向早期测试员逐步开放 凭借广泛的合作,我们还开始探索Veo 在电影制作领域的应用 最近,我们与极富远见的导演Darren Aronofsky 及其创新故事创作公司Primordial Soup达成了合作 共同探索如何塑造Veo的能力以满足创作需求 让艺术家引领技术创新方向 通过这一合作,我们将世界顶尖的视频生成模型 交付给最杰出的电影制作人,推动技术突破 打造更具创意性和情感表现力的创作工具 在计划制作的三部短片中 第一部作品是导演Eliza McNitt的《ANCESTRA》 现在就让我们来一睹为快 电影本质上是一种深刻的人类行为 它能将人们与彼此的故事联系起来 它能够将我们从自己的经历中抽离出来 带我们踏上另一段旅程 我认为这一点永远不会改变 这个故事虽然跨越整个宇宙的历史长河 但本质上讲述的是一位母亲的经历 以及当她那有心脏缺陷的孩子刚出生时所发生的一切 我们拍摄了演员真实的情感表演 但同时也通过AI生成了 那些用传统方式根本无法拍摄的画面 我想要婴儿紧握着母亲的手指那样的画面 展现他们之间那种幸福的时刻 是的 Veo是一个生成视频模型 但在我看来,它更像是一个全新的镜头 让我能够以不同方式想象身边的一切 探索这些模型的优势和局限 并尝试将它们打造成创作工具,这个过程非常有趣 老实说,我从未想过要讲述我出生那天的故事 但现在我们拍出来了 这原本只是一次普通的产检而已 紧急剖腹产! 胎儿有危险 我们这里需要帮助! 我们必须立刻手术 我的孩子能保住吗? 我们会尽一切努力 那我也会平安无事吗? 来自在你之前存在的每一个生命 来自为你的诞生而消亡的每一颗星辰 真是令人惊叹的杰作 Eliza巧妙地将真人实景表演 与Veo生成的内容,包括微观世界、宇宙景象 以及她自己作为新生儿的画面融为一体 这种方法开辟了全新的叙事可能性 使Eliza能够将宏大的电影视觉效果 和深厚的情感表达带入一个极为个人化的故事 这次合作也帮助我们塑造了Veo的功能 以满足像Eliza这样的故事创作者的需求 我们为电影制作人开发了多项新功能 所以当你创作视频时 无论你提供什么创作元素 角色、场景还是艺术风格 Veo都能确保它们在整个创作过程中保持一致性 你还可以像真正的导演一样指挥Veo 提供精确的相机指令 让它沿着特定路径拍摄 这些功能将帮助电影制作人 用Veo顺畅地表达自己的创意 而我们的创新并未止步于此 下面请Josh重返舞台 为大家介绍更多内容 谢谢,Jason 在与创意社区合作的基础上 我们为创作者打造了一款全新的AI电影制作工具 它结合了Veo、Imagen和Gemini三大技术的精髓 一款源自创作者、为了创作者打造的工具 它的设计灵感源自创作者那种 完全沉浸在创作中思如泉涌的奇妙境界 我们将这款工具命名为Flow,从今天起正式推出 我来给大家展示一下它的运作方式 我们来看看我正在创作的一个项目 故事的主角是一位老爷爷 他正在一位鸟类朋友的帮助下制造一辆会飞的汽车 这些是我的素材 这位老人和他的汽车 借助简便的界面 你可以轻松将自己的图像上传到工具中 或者,你可以使用内置的Imagen 即时生成所需的图像 只需简单描述就能生成一张定制金色变速杆图像 看,相当不错 接下来,你可以开始把所有这些素材组合起来 只需输入一条提示 你可以描述想要的效果,包括非常精确的镜头控制 Flow能将所有素材安排到恰当的位置 我可以在场景构建器中继续进行调整迭代 接下来是最精彩的部分 如果我想继续拍摄场景的下一个镜头 只要点一下这个加号,新镜头就自动生成了 我只需用文字描述接下来想要呈现的场景内容 比如在后座加上一只3米高的鸡 Flow将完成剩下的工作 角色将保持一致,场景也将保持一致 整个过程行云流水 如果对有些地方不太满意,也没关系 你可以像使用其他视频剪辑工具一样 随时返回剪掉那些不合适的片段 但Flow还支持反向操作 你还可以用它来延长素材片段 这样,我就得到了我一直追求的理想收尾镜头 所有片段制作完毕后,我可以把它们下载下来 然后把它们导入我常用的视频剪辑软件 再加上一小段Lyria生成的配乐 就这样,老爷爷终于开上了自己的“飞车” 简直太棒了 接下来,让我们听听几位新锐AI电影制作人的心声 他们在Flow的开发过程中为我们提供了宝贵意见 他们分享了自己使用Flow的感受 以及他们如何让这一工具变得更出色 一起来看看吧 我不知道自己是否走在正确的道路上 但一直在努力探索 我不断探索,不断质疑 直到某一刻,有些东西悄然改变 我不再纠结于正确与否,只是专注去做 然后,那些散落的拼图开始慢慢归位 我的思维变得非常清晰 无数种可能在我脑海中闪现 就像穿越时空般奇妙 当我以上帝视角审视身为创作者的自己 以及我所创作的不同世界中的角色 我感觉这些角色仿佛有着自己的生命 尽管我知道故事情节的走向由我掌控 似乎在某个时刻 这些故事开始沿着自己的脉络逐渐展开 你知道,你的故事可以有无数种结局 用Flow创作的作品不是简单的素材堆砌 它就像花园里的花,肆意绽放 它自然生长,充满生命力,浑然天成 我没有刻意去安排什么 那些画面只是在等着我找到它们 当我有这种感觉时,我就知道自己找对了方向 真是叹为观止,听到这些电影制作人讲述 如何将不可思议的想象变为现实 我们希望通过我们的工具 让大家都能享受这种自由构建、挥洒创意的感觉 所以我很激动地宣布 今天,我们将升级Google的两大AI订阅方案 我们将推出Google AI Pro 以及全新的Google AI Ultra 我们将面向全球推出Google AI Pro 相比Google AI的免费版本 你将拥有全套Google AI产品的使用权 并获享更高的用量限额和特殊功能 其中包括Gemini应用的Pro版本 也就是先前的Gemini Advanced 然后让我来介绍一下Google AI Ultra 它专门面向行业开拓者和先行者 以及Google前沿AI技术的尝鲜者 该方案将为用户提供最高用量限额 订阅者还可以抢先体验 Google发布的各项新产品和功能 Google AI Ultra今天仅面向美国推出 并将很快推广至全球 你可以把这个Ultra方案当成是 你专属的Google AI VIP通行证 订阅Google AI Ultra 你就能获得超高用量限额 等到2.5 Pro Deep Think模式推出后 还可以在Gemini应用中使用这种模式 你还可以抢先体验我们今天发布的Veo 3和Flow 该方案还附赠 YouTube Premium会员和海量存储空间 我们热切期待看到,借助这些全新订阅方案 你将构建、创造和挖掘出怎样的精彩 下面,让我们一同展望未来 探索我们将如何使用AI与现实世界互动 有请Shahram 大家好 此刻,Android平台正在发生许多激动人心的变化 在这个平台中,你将率先预见未来 在上周的Android Show上 我们公布了Android 16和Wear OS 6 全新的大胆设计和重大更新 当然,Android也是体验Google AI的绝佳平台 你今天看到的许多Gemini突破性创新 都会在不久之后登陆Android 你现已可以通过电源按钮立即访问Gemini 它能理解你的意图和上下文,并随时为你提供帮助 Android不止是手机系统 更是一个完整的设备生态系统 在接下来的几个月 我们将把Gemini引入你的手表、汽车仪表盘 甚至电视 无论你身在何处 都会有一位有用的AI助理伴你左右,让你的生活更轻松 那么,要不要尝试一些新兴的设备形态 让我们以全新方式体验AI助理? 这正是我们打造Android XR的原因 它是首个在Gemini时代构建的Android平台 支持不同应用场景的各种设备 从头戴设备到智能眼镜,以及其他各种智能设备 我们认为,没有哪种扩展现实设备是万能的 你在一天当中会用到不同的设备 比如,在看电影、玩游戏或处理工作时 你想要的是沉浸式头戴设备 但外出时,你会想要一副轻便的智能眼镜 让你不用掏出手机就能获得及时的信息 我们携手三星共同打造了Android XR 并与高通合作,针对骁龙处理器对其进行了优化 自从去年Android XR开发者预览版发布以来 已有数百名开发者在为该平台构建应用 我们也在为Android XR重新构建 你喜爱的各种Google应用 由于它是Android系统 所以你的手机和平板应用也与它兼容 今天,我想跟大家分享 Gemini如何颠覆头戴设备和智能眼镜用户的体验 在这些设备上 AI助理会以更丰富的方式理解你的上下文和意图 全天候为你提供支持 让我们从头戴设备中的Gemini说起 这是三星的Project Moohan,首款Android XR设备 Moohan提供无限延展的屏幕空间 让你在Gemini的陪伴下尽情探索各种应用 Android XR还集成了Google地图 只要告诉Gemini你想去哪里 它就能带你“瞬间传送”到世界任何角落 你可以和AI助理谈论你看到的一切 并让它调出你想要探索的视频和网站 我们都希望能买到自己支持球队的季票 想象一下,当你使用Moohan在MLB应用上观看球赛 你将仿佛置身现场 还可以一边观赛一边和Gemini讨论球员和比赛数据 三星的Project Moohan将于今年晚些时候发售 我们迫切期待你们能亲身体验这款设备 现在,让我们把注意力转向智能眼镜 众所周知,我们在智能眼镜领域耕耘超过十年 从未停下脚步 搭载Android XR的智能眼镜满载先进科技 但无比轻盈,适合全天佩戴 眼镜内置镜头和麦克风 让Gemini能够“看到”和“听到”这个世界 扬声器则让你可以与AI对话、播放音乐或接听电话 你也可以通过镜片内置显示屏 以私密的方式在需要时查看有用的信息 这款眼镜可以与你的手机连接 让你不用动手也能访问应用 这一切都让智能眼镜成为天然适合AI的设备形态 让Gemini的强大功能随时伴你左右 所以,与摘下眼镜才能变身的超人不同 戴上这款智能眼镜,你就能获得“超能力” 好了,谁想看Android XR眼镜的最新演示? 让我们看看它在最忙乱的环境中表现如何 比如…I/O大会的后台 我们的“超级女侠”Nishtha就在后台 她将向我们展示这款眼镜在真实环境中的使用效果 我现在就给她发个消息,然后我们马上开始 大家好! 现在,你们应该能在大屏幕上看到 我通过Android XR智能眼镜镜片看到的一切 比如这杯美味的咖啡 还有Shahram刚刚发来的这条消息 让我们看看他说了什么 很好,现在就是见证奇迹的时刻 我要启动Gemini,开始演示 给Shahram发一条消息,告诉他我已经开始了 然后把我的通知静音 好的,我已经给他发了消息 并且把你所有的通知静音了 很好 嘿,Nishtha! 嘿,Dieter! 你的灯亮着,看来我们已经开始直播了? 是的,我们已经和I/O大会的工作人员连上线了 大家好。从这个视角看I/O大会,真是太棒了! Nishtha,你答应过我 只要我来帮忙,就送我一副Android XR眼镜 说话算数吗? 当然! 待会结束后我们去喝杯咖啡 我会把你的智能眼镜带过去! 太棒了!待会见!祝你演示顺利 谢谢 大家可以看到,我们在后台,这里真是热闹非凡 那是职业篮球运动员Giannis戴着我们的眼镜吗? 我太喜欢这眼镜了! 它解放了我的双手,让我随时能来个双手击掌 太棒了,我继续来展示这副眼镜的功能 今天一整天,我都对这面照片墙很好奇 比如这是什么乐队,他们和这个地方有什么联系? 这是Counting Crows 一支来自旧金山湾区的传奇摇滚乐队 他们在Shoreline Amphitheatre演出过很多次 这里通常被视为是他们的返乡主场 天哪!你能给我看看他们在这里演出时的照片吗? 当然,这有一张,想让我播放一首他们的歌曲吗? 好啊,我可以一边听一边走向舞台 太好了!请听Counting Crows的《Under the Aurora》 好了,大家准备好一睹这副眼镜的风采了吗? 让我们欢迎Nishtha! Nishtha,欢迎欢迎! 大家好! 谢谢你为我们带来这段星光熠熠的幕后之旅 对了,你现在要约Dieter去喝咖啡吗? 当然…刚刚工作人员在后台给了我一杯超棒的咖啡 所以让来我试试一些好玩的功能 Gemini,刚刚那杯咖啡上的咖啡店名字是什么? 嗯…可能是Bloomsgiving 据我所知 那是卡斯特罗街上一家充满活力的咖啡馆 记性真好 你能给我看看那家咖啡馆的照片吗? 我想看看那里的氛围 没问题 这些是来自Google地图的照片,请问有帮助吗? 哦,我知道那个地方 它是一家花店,同时也卖咖啡,但它在市中心 好吧,Gemini,我走过去需要多久? 正在获取路线 步行过去大概需要1小时 好吧 也许我可以走过去,顺便刷点步数 眼镜上会直接显示完整3D地图和导航,会很轻松 帮我约Dieter今天下午3点在那家咖啡馆喝咖啡 我马上发出邀请 希望你们享受愉快的咖啡时光 如你们所见,Gemini帮助Nishtha搜索她看到的东西 记住咖啡杯这种细节 为她安排日程、甚至为她导航 而Nishtha全程都不用掏出手机 其实我现在也戴着这副眼镜 它相当于是我的个人提词器 而且它的镜片还带度数,所以我能看清你们 Nishtha,这是智能眼镜的高光时刻 我们把这一刻记录下来吧 好的 大家准备好,我们快速合个影 让我们把后台的明星也请上来! 这是Dieter Janice来了 Gemini,帮我拍张照 Gemini,帮我拍张照,保存到我的收藏夹里 拍得真好! 我是个彻头彻尾的追星族 好的,还有最后一件事 之前,Sundar展示了实时翻译已经发展到什么程度 现在让我们看看它在智能眼镜上的表现 这个演示很有挑战,但我们试试吧! Nishtha和我要用各自的母语交谈 Nishtha说印地语 我说波斯语,虽然我说得很烂 你们会在大屏幕上看到我俩眼镜上的实时画面 这样你们都可以明白我们在说什么 我们会实时显示英语译文 好吧,我们试试,但愿一切顺利 [波斯语] [波斯语] [印地语] [波斯语] [波斯语] 我们之前没说错,确实演示有风险 让我们… 感谢Nishtha 带我们领略了Android XR智能眼镜的魅力 有了这些Android XR设备 就好像身边有一位非常得力的助理 它将为我们带来怎样的精彩?让我们拭目以待 这还不是全部 我们正在与三星深化合作 将Android XR从头戴设备扩展到智能眼镜 我们正在创建软件和参考硬件平台 以便生态系统中的伙伴们能够与我们一起 打造出强大的智能眼镜 我们的眼镜原型目前正在由可信测试员试用 今年晚些时候,你们就可以开始为这款眼镜开发应用了 我们知道,智能眼镜必须足够时尚 你才会愿意全天佩戴 因此,今天,我们很高兴地宣布 Gentle Monster和Warby Parker 将成为我们的首批眼镜制造商合作伙伴 与我们一同打造搭载Android XR的时尚眼镜 我们希望你能戴上符合你个人品味的眼镜 这些还仅仅是开始 我热切期待你们亲自体验Android XR 在接下来的几个月,我们还会有更多精彩与大家分享 谢谢大家 这些XR眼镜实在太棒了! 就在我们眼前,研究成果转化成了现实应用 好的,我们的演讲已经接近尾声 今天你们听到了很多关于Elo评分 基准测试和先进性能的内容 但我知道大家还在等着看另外一项数据 那就是AI统计的词频数据 那么,让我们来看这最后一个排行榜 看起来,又有新选手入围了 Gemini领先 以95次的成绩胜出 非常令人振奋 言归正传,以上就是我们今天分享的所有内容 从新产品发布、产品扩展,到未来展望 AI带来了前所未有的机遇 未来的关键就在你们这些开发者和技术创新者手中 你们将推动这项技术的普及,让更多人能从中受益 最后,我想跟大家分享几个给我带来激励的真实案例 首先是加州居民以及世界各地的人们 最关心的问题——野火 想必有许多人都认识野火的受灾者 野火的发生往往很突然,并在几分钟内失控蔓延 因此,野火检测的速度和精度至关重要 我们正在与一群了不起的合作伙伴一起 构建一个名为FireSat的项目 它是一个卫星星座,利用多光谱卫星图像和AI 旨在提供近乎实时的野火观测数据 看看这个分辨率 它可以探测到面积小至25平方米的火灾 大约相当于一个单车位车库的大小 我们的第一颗卫星现已入轨 项目全面投入运行后 图像更新频率将大幅提高 从目前的每12小时更新一次 缩短到每20分钟更新一次 在其他类型的应急响应中,速度同样至关重要 例如,在海伦飓风期间 Wing与沃尔玛、红十字会合作 用无人机投送物资,为救援工作提供了支持 在AI的帮助下 我们能够根据实时需求将食物、药品等关键物资 投放到北卡罗来纳州的一个基督教青年会避难所 可以想象这在其他社区的救灾行动中会有多大帮助 我们也正在积极努力扩大这一技术的应用范围 这些都是AI目前造福社会的例子 尤其令人鼓舞的是 今天的研究成果将在短短几年内成为现实 无论是构建下一代实用机器人 为世界致死率最高的疾病寻找治疗方法 还是推进纠错量子计算机的发展 或是打造能将乘客安全送达 任何地点的全自动驾驶汽车 所有这些都极有可能在几年内实现,而不是几十年 真是令人向往 这种利用AI改善生活的机会并不是我在想当然 最近的一次经历让我深有体会 当时我和父母一起到旧金山旅游 与许多其他游客一样 他们想做的第一件事就是体验Waymo的自动驾驶 我以前也坐过Waymo 但看着我八十多岁的父亲坐在前排那种惊讶的表情 我从全新的视角看到了科技进步的影响 它让我看到,科技拥有多么不可思议的力量 它能激发灵感、造福所有人、并推动我们前进 我迫不及待想看看 接下来我们会共同创造出怎样的精彩成果 谢谢大家 Flow为我开启了无限可能 那是什么样的魔法? AI模式是自搜索引擎发明以来最伟大的革命 只需准确地告诉Gemini你想要构建什么 它就会为你搞定 天哪 你可以用Gemini 2.5 Pro编程 实在太好用了 Project Mariner将改变我们使用浏览器的方式 它是一个能帮你处理事务的AI智能体 Notebook LMS思维导图颠覆了我们学习的方式 为什么无论我走到哪,这个人都在跟踪我? 那是你的影子 等等,你要右转 AI正在彻底改变我们对抗野火的方式 生成式媒体正在拓展创造力的边界 我第一次看到这个的时候,感觉就像魔法一样 它不仅仅是又一项工具 它颠覆了一切 简直让我大开眼界 AI的潜力近乎无限