0:01:14.263,0:01:17.767 好棒的视频,看来大家的制作过程应该很开心 0:01:18.534,0:01:20.136 大家上午好 0:01:20.269,0:01:21.537 欢迎参加Google I/O大会 0:01:27.276,0:01:29.745 欢迎亲临Shoreline会场的各位 0:01:30.146,0:01:33.649 以及世界各地在线上观看的观众 0:01:34.250,0:01:37.186 有人告诉我,Gemini季从今天起拉开序幕 0:01:37.853,0:01:39.689 我倒没觉得这有什么特别 0:01:39.855,0:01:42.391 因为对Google来说,每一天都是Gemini季 0:01:44.093,0:01:47.797 在I/O大会前的几周,我们通常不会有太多动作 0:01:48.397,0:01:52.101 因为我们想把最好的模型留到这个舞台上来展示 0:01:52.735,0:01:54.170 但在Gemini时代 0:01:54.337,0:01:56.539 我们也会在三月随便选个周二 0:01:56.606,0:01:59.775 发布我们最智能的模型 0:02:00.242,0:02:01.777 或是非凡的突破 0:02:01.844,0:02:04.213 就像在大会一周前发布AlphaEvolve那样 0:02:05.114,0:02:07.984 只想尽快将我们最好的模型交到你的手中 0:02:08.317,0:02:10.486 让你尽快体验到我们的产品 0:02:10.987,0:02:13.889 为此,我们的发布频率远超以往 0:02:14.624,0:02:15.791 自上届I/O大会至今 0:02:15.858,0:02:18.227 我们发布了十多种模型和研究突破 0:02:18.461,0:02:24.000 以及二十多种重要AI产品和功能 0:02:24.900,0:02:28.471 模型的快速进步让我振奋不已 0:02:29.038,0:02:31.340 从这张图表就能看出阶跃式的发展 0:02:32.141,0:02:34.610 Elo分数用来衡量进步的尺度 0:02:34.877,0:02:36.979 从第一代Gemini Pro至今 0:02:37.046,0:02:39.148 这项成绩提升了300多分 0:02:39.682,0:02:42.418 如今,Gemini 2.5 Pro 0:02:42.485,0:02:46.088 横扫LMArena排行榜的所有类别 0:02:53.462,0:02:56.365 在许多基准测试中都表现突出 0:02:56.666,0:02:59.502 在编程方面,我们也在快速进步 0:02:59.969,0:03:03.806 更新版的2.5 Pro在WebDev Arena中一马当先 0:03:04.040,0:03:08.544 Elo分数比上一个版本高142分 0:03:09.345,0:03:12.214 这款模型在各大主流编程平台上备受追捧 0:03:12.281,0:03:13.482 感谢所有人的支持 0:03:14.116,0:03:17.186 在领先AI代码编辑器cursor中 0:03:17.586,0:03:20.489 Gemini成为年度发展速度最快的模型 0:03:20.790,0:03:25.695 每分钟都有数十万行代码用它生成 0:03:26.729,0:03:29.932 最后这个里程碑或许最令人动容 0:03:30.132,0:03:31.701 至少在某些圈子里是如此 0:03:32.201,0:03:35.738 几周前,Gemini成功通关《宝可梦蓝》 0:03:39.709,0:03:43.345 集齐全部八枚徽章,挺进“冠军之路” 0:03:43.412,0:03:46.182 打败了四天王和联盟冠军 0:03:46.549,0:03:49.885 这让我们离实现API又近了一步 0:03:50.319,0:03:52.722 不过我们说的是“人工宝可梦智能” 0:03:58.060,0:04:01.731 所有这些进步都由我们卓越的基础设施提供支持 0:04:01.831,0:04:04.667 它是我们全栈式AI方法的基石 0:04:05.367,0:04:09.739 我们的第七代TPU Ironwood采用前沿设计 0:04:09.839,0:04:12.274 为大规模思考和推理赋能助力 0:04:12.908,0:04:16.245 其性能达到上一代的十倍 0:04:16.579,0:04:22.051 能迸发出每个pod 42.5 exaFLOPS的强大算力 0:04:22.151,0:04:22.985 令人赞叹 0:04:23.486,0:04:26.722 Google Cloud客户今年稍后就能切身体会它的实力 0:04:30.793,0:04:33.829 凭借始于底层TPU的基础设施实力 0:04:33.896,0:04:37.666 我们提供了速度更出众的模型 0:04:38.200,0:04:40.669 在LMArena排行榜的顶尖模型中 0:04:40.736,0:04:43.105 Gemini跻身前三 0:04:43.305,0:04:46.308 凭借最高的每秒生成token数 0:04:46.809,0:04:50.679 以及大幅下降的模型价格取得骄人成绩 0:04:51.247,0:04:54.083 在价格与性能之间权衡并不容易 0:04:54.683,0:04:56.919 然而,我们一次又一次地做到了 0:04:56.986,0:05:00.523 以最有效的价格点提供出色的模型 0:05:01.157,0:05:03.692 Google不仅在这个帕累托最优边界中先人一步 0:05:03.959,0:05:06.295 更从根本上改变了它 0:05:07.229,0:05:12.001 让每个人都能随时随地享受更好的智能体验 0:05:12.601,0:05:14.670 我们的努力收获了积极的回应 0:05:14.770,0:05:16.972 AI采用速度远超以往 0:05:17.973,0:05:21.577 作为进步的标志之一,在去年此时 0:05:21.977,0:05:28.484 我们所有产品和API[br]每个月的token处理总量是9.7万亿 0:05:29.018,0:05:33.289 而如今,每月token处理量达到了480万亿 0:05:33.589,0:05:36.959 短短一年,接近50倍的增幅 0:05:42.898,0:05:47.136 我们各类开发者AI工具的采用已成浪潮 0:05:47.536,0:05:50.139 在Google AI Studio和Vertex AI中 0:05:50.206,0:05:54.877 有700多万名开发者在使用Gemini API进行开发 0:05:55.277,0:05:57.680 达到去年召开I/O大会时的五倍多 0:05:58.147,0:05:59.548 自去年以来 0:05:59.615,0:06:03.752 Gemini在Vertex AI中的使用量增加到40多倍 0:06:04.687,0:06:07.356 我们的产品也在越来越多地采用AI 0:06:07.590,0:06:11.727 Gemini应用的月活用户数已超过4亿 0:06:12.161,0:06:14.763 增长幅度和参与度都在强势增长 0:06:15.097,0:06:17.166 尤其是2.5版的模型 0:06:17.633,0:06:20.669 对于在Gemini应用中使用2.5 Pro模型的用户 0:06:20.903,0:06:23.372 使用量增长了45% 0:06:23.806,0:06:26.909 稍后你会听到许多与Gemini应用有关的消息 0:06:27.776,0:06:30.179 在搜索领域,我们也看到了十分惊人的发展势头 0:06:30.713,0:06:36.285 AI概览的月用户量现已超过15亿 0:06:37.019,0:06:40.356 也就是说,通过Google搜索使用生成式AI的用户量 0:06:40.856,0:06:44.159 超过全球其他任何产品 0:06:44.760,0:06:50.099 除了AI概览之外,AI模式也是搜索领域的一大进步 0:06:50.566,0:06:52.534 稍后我们会分享更多相关信息 0:06:53.702,0:06:55.571 所有这些进步都指向一件事 0:06:56.405,0:06:59.441 我们身处AI平台变革的新阶段 0:07:00.109,0:07:03.178 数十载的研究成果转化为实用工具 0:07:03.245,0:07:05.214 惠及普罗大众 0:07:05.881,0:07:07.683 我想分享三个例子 0:07:07.750,0:07:11.320 证明研究如何彻底改变我们当今的产品 0:07:11.754,0:07:15.591 分别是Project Starline、Astra和Mariner 0:07:16.625,0:07:18.360 在几年前的I/O大会上 0:07:18.427,0:07:20.496 我们公布了Project Starline 0:07:20.562,0:07:22.097 这是我们突破性的3D视频技术 0:07:22.665,0:07:26.235 让你在与千里之外的人交流时 0:07:26.635,0:07:28.237 也能有共处一室的感觉 0:07:28.737,0:07:31.006 我们不断改进相关技术 0:07:31.407,0:07:34.243 今天,我们终于准备好开启它的下一篇章 0:07:34.610,0:07:36.211 隆重介绍Google Beam 0:07:36.545,0:07:40.616 全新的AI优先型视频沟通平台 0:07:41.517,0:07:44.787 Beam运用全新的先进视频模型 0:07:45.287,0:07:50.125 将2D视频流转化为栩栩如生的3D体验 0:07:51.026,0:07:56.165 在幕后,六摄像头阵列从不同角度拍摄你的影像 0:07:56.732,0:08:00.736 这些视频流随后会通过AI合并在一起 0:08:00.903,0:08:03.505 生成3D光场显示,展示你的立体形象 0:08:04.039,0:08:07.076 它能实现毫米级精度的头部跟踪 0:08:07.443,0:08:10.879 以及每秒60帧的实时渲染 0:08:11.480,0:08:17.152 成就高度自然流畅、沉浸感十足的对话体验 0:08:17.720,0:08:20.422 我们热切期待将这项技术带给大家 0:08:21.056,0:08:22.524 并为此与惠普开展了合作 0:08:22.591,0:08:24.493 首款Google Beam设备 0:08:24.827,0:08:28.797 将于今年晚些时候与首批客户见面 0:08:29.898,0:08:32.501 从现在起的几周内,惠普会分享大量相关资讯 0:08:32.768,0:08:33.736 敬请关注 0:08:40.509,0:08:43.012 多年来,我们一直在不懈努力 0:08:43.078,0:08:45.914 将Starline的底层技术整合到Google Meet中 0:08:46.515,0:08:51.020 其中包括帮助打破语言壁垒的实时语音翻译 0:08:51.954,0:08:55.057 这个例子展示了在南美洲预定度假屋 0:08:55.324,0:08:58.093 而你又不会讲当地语言时 0:08:58.360,0:08:59.862 这项功能的实用价值 0:08:59.962,0:09:00.796 我们一起来看看吧 0:09:02.865,0:09:04.066 嗨,Camilla 0:09:04.400,0:09:06.502 我来打开语音翻译功能 0:09:08.937,0:09:11.040 终于能跟你直接对话了,太棒了 0:09:11.140,0:09:15.277 [西班牙语翻译] 0:09:16.311,0:09:18.247 [西班牙语回答] 0:09:18.313,0:09:19.548 你会很开心的 0:09:19.648,0:09:22.151 我相信你也一定会爱上这座城市 0:09:22.384,0:09:26.388 这间房所在的社区环境很好,还能俯瞰山景 0:09:26.622,0:09:28.057 听起来真不错 0:09:29.324,0:09:34.363 [西班牙语翻译] 0:09:34.963,0:09:37.032 [西班牙语回答] 0:09:37.166,0:09:38.500 附近就有公交车 0:09:38.834,0:09:44.173 不过我推荐你租辆车,这样去野外玩更方便 0:09:44.640,0:09:46.442 听起来不错 0:09:46.742,0:09:48.177 [西班牙语翻译] 0:09:55.818,0:09:58.554 如你所见,语音翻译惟妙惟肖地模仿了 0:09:58.620,0:10:01.790 讲话人的语气、模式甚至是表达方式 0:10:02.724,0:10:08.030 我们距离自然流畅的跨语言沟通又近了一步 0:10:08.597,0:10:12.234 我们现已直接将这种实时语音翻译功能 0:10:12.301,0:10:13.869 直接整合到Google Meet中 0:10:14.436,0:10:18.474 订阅者从现在起即可使用英语与西班牙语互译功能 0:10:18.841,0:10:22.845 在未来几周内,我们还会推出更多语言的翻译功能 0:10:23.412,0:10:27.349 实时翻译功能将于今年晚些时候面向企业用户开放 0:10:34.356,0:10:36.291 另一个在往届I/O舞台上正式亮相的 0:10:36.358,0:10:38.694 早期研究项目是Project Astra 0:10:39.294,0:10:45.868 专门探索通用型AI助手未来理解你身边世界的能力 0:10:46.401,0:10:48.137 我们正在将其整合到Google产品中 0:10:48.804,0:10:50.339 Gemini Live现已整合 0:10:50.405,0:10:53.809 Project Astra的相机和屏幕共享功能 0:10:54.176,0:10:56.478 支持就你看到的任何事物展开对话 0:10:56.945,0:10:59.014 人们正在将它用于各种用途 0:10:59.314,0:11:01.383 无论是为工作面试做练习 0:11:01.617,0:11:03.252 还是为备战马拉松而训练 0:11:03.719,0:11:06.855 我们始终高度重视可信测试员的反馈 0:11:07.222,0:11:10.092 还有一些不那么“可信”的测试员 0:11:10.159,0:11:11.160 一起来看看吧 0:11:14.263,0:11:15.864 好漂亮的敞篷车 0:11:16.498,0:11:19.968 我觉得你把垃圾车误认成敞篷车了 0:11:20.068,0:11:21.803 我还能帮你些什么? 0:11:21.937,0:11:24.239 这个细长的建筑物怎么杵在我家门口? 0:11:24.373,0:11:26.942 这是路灯,不是建筑物 0:11:27.409,0:11:30.479 这些棕榈树怎么这么矮?看着让人有点担心 0:11:31.013,0:11:33.916 它们并不矮,其实很高的 0:11:34.483,0:11:35.851 帅气的敞篷车 0:11:36.151,0:11:37.653 还是垃圾车 0:11:38.086,0:11:39.321 还有别的事吗? 0:11:39.388,0:11:42.357 为什么总有人把快递放到我的草坪上? 0:11:42.891,0:11:45.494 那不是快递,是个变电箱 0:11:45.928,0:11:48.697 我走路的时候,这个人怎么一直跟踪我 0:11:49.531,0:11:52.434 没人在跟踪你,那只是你的影子 0:12:01.109,0:12:03.679 Gemini真的特别擅长给你挑错 0:12:05.147,0:12:10.485 即日起,此功能面向所有Android和iOS用户开放 0:12:18.060,0:12:21.697 再说说我们的研究原型Project Mariner 0:12:22.397,0:12:26.335 这种智能体可以与Web交互并完成各种任务 0:12:27.169,0:12:29.271 我们跳出原有思维模式,将智能体视为一种系统 0:12:29.338,0:12:34.443 集先进AI模型的智能和访问工具的能力于一身 0:12:35.077,0:12:38.547 它们可以自主帮你执行操作,而且完全由你掌控 0:12:39.147,0:12:42.451 使用计算机是智能体的一项重要能力 0:12:42.985,0:12:46.855 让智能体能够与浏览器和其他软件交互 0:12:47.155,0:12:48.490 并对其执行操作 0:12:49.258,0:12:53.695 Project Mariner是测试计算机使用能力的初步尝试 0:12:54.296,0:12:57.499 去年12月,我们将其作为早期研究原型发布 0:12:57.799,0:12:59.935 自那之后取得了长足进展 0:13:00.469,0:13:03.538 首先,我们引入了多任务处理能力 0:13:03.772,0:13:07.175 它如今能同时管理多达10个任务 0:13:08.143,0:13:11.246 其次,它使用了一项名为“示教与重复”的功能 0:13:11.680,0:13:14.283 你只要向它展示一次任务 0:13:14.650,0:13:18.020 它就能学会在将来为类似任务做计划 0:13:18.620,0:13:21.990 我们将通过Gemini API向开发者提供 0:13:22.324,0:13:24.860 Project Mariner的计算机使用能力 0:13:25.661,0:13:28.463 Automation Anywhere和UiPath等可信测试方 0:13:28.530,0:13:31.633 已经开始使用它构建产品 0:13:32.100,0:13:35.037 我们将于今年夏季将其提供给更广泛的用户 0:13:35.904,0:13:37.806 为了推动智能体生态系统繁荣发展 0:13:37.873,0:13:39.641 我们需要开发更广泛的工具组合 0:13:39.708,0:13:41.810 计算机使用能力就是这项工作的一环 0:13:42.344,0:13:43.945 这方面的例子有我们的开放智能体间协议 0:13:44.012,0:13:46.548 让智能体能够彼此对话 0:13:47.182,0:13:48.750 我们在Cloud Next大会上发布了这种协议 0:13:48.817,0:13:51.520 获得了60多家技术合作伙伴的支持 0:13:51.820,0:13:53.522 这个数字还有望继续增长 0:13:54.256,0:13:57.993 还有Anthropic推出的模型上下文协议 0:13:58.126,0:14:00.529 让智能体可以访问其他服务 0:14:01.063,0:14:03.031 今天,我们要激动万分地宣布 0:14:03.098,0:14:07.569 Gemini SDK现已兼容MCP工具 0:14:13.375,0:14:17.446 这些技术将协同运作,让智能体更实用 0:14:17.813,0:14:20.682 我们已经开始将代理式功能添加到 0:14:20.782,0:14:22.484 Chrome、Google搜索和Gemini应用中 0:14:22.551,0:14:26.888 我来展示一下Gemini应用中最让我们激动的功能 0:14:27.055,0:14:29.024 我们称之为智能体模式 0:14:29.624,0:14:33.628 假设你想在奥斯汀给自己和两名室友找间公寓 0:14:34.029,0:14:36.665 你们每个人每月的预算是1200美元 0:14:37.265,0:14:38.667 希望公寓里有洗衣机、干衣机 0:14:38.734,0:14:40.736 或者至少附近要有间洗衣店 0:14:41.236,0:14:45.307 通常情况下,你要花很多时间去浏览无数房源 0:14:46.074,0:14:49.277 但有了智能体模式,Gemini应用可以为你效力 0:14:49.344,0:14:51.713 它在后台访问Zillow等网站 0:14:51.780,0:14:54.716 查找符合你的条件的房源 0:14:55.350,0:14:57.586 并在需要时使用Project Mariner 0:14:57.652,0:14:59.921 调整极其细致的过滤条件 0:15:00.455,0:15:04.025 如果有你想具体了解的公寓,Gemini会使用MCP 0:15:04.426,0:15:08.663 访问房源,甚至可以帮你安排行程 0:15:09.097,0:15:12.801 只要你需要,它就会不断浏览查找新房源 0:15:13.602,0:15:16.138 让你可以腾出时间去做自己想做的事情 0:15:16.204,0:15:17.739 比如规划乔迁派对 0:15:18.373,0:15:20.008 这对Zillow这样的公司特别有用 0:15:20.075,0:15:23.545 能够带来新客源并提高转化率 0:15:24.312,0:15:27.449 Gemini应用中智能体模式的实验版本 0:15:27.516,0:15:30.018 即将面向订阅者开放 0:15:30.619,0:15:32.788 这是一个崭露头角的全新领域 0:15:33.255,0:15:34.890 我们很激动能亲身探索 0:15:34.990,0:15:40.395 如何将智能体的优势带给用户和更广泛的生态系统 0:15:41.630,0:15:44.366 要将研究成果落地,我们最好的方案就是 0:15:44.499,0:15:47.769 保证它在你的实际环境中拥有真正的实用价值 0:15:48.336,0:15:51.907 这正是个性定制的用武之地 0:15:52.507,0:15:56.912 为此,我们推出了个人使用场景功能 0:15:57.779,0:15:58.947 在征得你的许可之后 0:15:59.080,0:16:01.049 Gemini模型可在你的各Google应用之间 0:16:01.116,0:16:02.951 使用相关背景信息 0:16:03.618,0:16:05.887 并且采用一种保护隐私、高度透明 0:16:05.954,0:16:07.422 完全由你掌控的方式 0:16:08.156,0:16:10.392 我来展示一个Gmail中的例子 0:16:11.059,0:16:14.396 你可能很熟悉我们依托AI技术的智能回复功能 0:16:14.563,0:16:16.798 其受欢迎的程度甚至令人有几分意外 0:16:17.032,0:16:20.469 如果AI生成的回复能效仿你的口吻,那该有多好 0:16:21.102,0:16:24.206 这就是个性化智能回复背后的理念 0:16:25.307,0:16:27.909 假设朋友写信给我,向我寻求建议 0:16:28.443,0:16:33.748 他打算到犹他州去自驾游,记得我曾自驾去过那里 0:16:34.483,0:16:36.451 坦白说,如果我自己写回信 0:16:36.518,0:16:38.653 只会寥寥几句带过,帮不上什么忙 0:16:38.954,0:16:39.955 抱歉了,Felix 0:16:40.922,0:16:44.226 但使用个性化智能回复,我就能成为知心好友 0:16:44.926,0:16:49.598 因为Gemini会帮我做好几乎所有的“功课” 0:16:50.198,0:16:52.167 查看我云端硬盘中的笔记 0:16:52.467,0:16:54.936 查询旧电子邮件中的预订信息 0:16:55.237,0:16:57.839 查找Google文档中的行程安排 0:16:58.173,0:16:59.774 锡安国家公园之旅 0:17:00.542,0:17:04.012 Gemini效仿我既往邮件中的问候语 0:17:04.479,0:17:09.484 捕捉到了我的语气、风格和遣词用句的喜好 0:17:09.718,0:17:12.554 随后自动生成回复 0:17:13.288,0:17:15.056 我最欣赏的是它添加了贴心的细节 0:17:15.123,0:17:17.792 比如将驾车时间控制在每天五小时以下 0:17:18.126,0:17:21.263 还使用了我最喜欢的形容词:激动人心 0:17:22.931,0:17:24.165 看起来不错 0:17:24.232,0:17:27.602 或许简单修改几处,就可以点击“发送”了 0:17:28.236,0:17:31.940 今年夏天,这项功能就会在Gmail中提供给订阅者 0:17:37.846,0:17:40.482 可想而知,覆盖搜索、文档、Gemini 0:17:40.549,0:17:44.219 及其他产品的个人使用场景功能会有多实用 0:17:45.387,0:17:50.158 今天我谈到了智能、智能体和个性化 0:17:50.759,0:17:53.995 这是我们将努力推进的几个前沿领域 0:17:54.062,0:17:57.098 在整场主旨演讲中,你会听到更多例子 0:17:57.832,0:17:59.367 但首先,我想请一个人 0:17:59.434,0:18:03.004 详细分享有关推动我们未来创新的智能 0:18:03.705,0:18:06.741 去年在介绍他的时候,我称他为Demis爵士 0:18:07.042,0:18:11.146 今年,我们还可以在他的头衔里[br]加上“诺贝尔奖获得者” 0:18:11.212,0:18:12.747 Demis,请上台来 0:18:27.395,0:18:30.398 大家好!很高兴能再次参加Google I/O大会 0:18:31.499,0:18:34.102 我们身处一个重要的历史节点 0:18:34.603,0:18:37.939 AI正在开启令人向往的全新未来 0:18:38.673,0:18:40.308 这一年,我们在不懈的探索中前行 0:18:40.375,0:18:41.509 收获了累累硕果 0:18:42.177,0:18:46.181 正如Sundar所说,人们喜欢与Gemini 2.5交互 0:18:46.915,0:18:48.683 我们见证了你们用它进行氛围编程 0:18:48.783,0:18:51.052 一气呵成开发应用与游戏 0:18:51.753,0:18:54.155 见证了你们用它强大的推理能力完成各种任务 0:18:54.222,0:18:57.592 从拆解科学论文,到解析YouTube视频 0:18:58.059,0:19:00.295 你们告诉我们,Gemini协作性强、洞见深刻, 0:19:00.395,0:19:03.365 是真正的得力助手 0:19:04.232,0:19:08.637 看到大家用它创造出的惊人成果,我们倍感振奋 0:19:10.438,0:19:13.742 Gemini 2.5是我们迄今为止最智能的模型 0:19:14.009,0:19:16.177 也是全球先进基础模型 0:19:16.911,0:19:20.915 就在两周前,我们发布了升级后的2.5 Pro预览版 0:19:21.149,0:19:24.152 让大家可以开始亲手尝试用它将创想化为现实 0:19:25.353,0:19:27.489 大家的成果让我们大开眼界 0:19:27.789,0:19:33.228 从将草图转化为交互式应用到模拟3D城市 0:19:34.262,0:19:36.331 全新的2.5 Pro模型在热门编程排行榜 0:19:36.398,0:19:38.533 WebDev Arena上一马当先 0:19:39.334,0:19:41.503 现在,它又整合了LearnLM 0:19:41.703,0:19:44.406 该系列模型的开发得到了教育专家的支持 0:19:44.606,0:19:47.742 这让2.5 Pro也成为全球出色的学习辅助模型 0:19:48.476,0:19:52.347 在LMArena的所有排行榜上独占鳌头 0:19:54.516,0:19:57.919 Gemini Flash是我们极其高效的王牌模型 0:19:58.420,0:20:02.857 因出色的速度和较低的成本备受开发者青睐 0:20:03.925,0:20:08.530 今天我要激动地宣布推出更新版的2.5 Flash 0:20:09.197,0:20:12.300 新版Flash模型几乎在每一个方面都有所改进 0:20:12.500,0:20:14.135 在各类重要基准测试中都取得了更好的成绩 0:20:14.202,0:20:16.938 包括推理、编程和长上下文 0:20:17.572,0:20:22.844 实际上,它在LMArena排行榜上仅次于2.5 Pro 0:20:24.145,0:20:28.216 我要很高兴地告诉大家,Flash将于六月初正式上线 0:20:28.383,0:20:29.851 Pro紧随其后 0:20:36.558,0:20:39.594 我们正在根据大家的反馈做出最终调整 0:20:39.728,0:20:42.564 不过你现在可以在AI Studio 0:20:42.630,0:20:45.200 Vertex AI和Gemini应用中试用预览版 0:20:46.768,0:20:50.538 我们将一如既往,继续不懈前行,推动技术向前发展 0:20:50.739,0:20:53.441 并对我们近期的研究突破感到十分欣喜 0:20:54.008,0:20:56.811 稍后我会请Tulsee来与大家进一步分享 0:20:56.978,0:20:58.680 不过首先,我们来看一下 0:20:58.747,0:21:00.815 目前你可以用Gemini来做些什么 0:21:04.052,0:21:06.121 [用Gemini可以做的30件事] 0:21:06.688,0:21:07.789 [物理模拟] 0:21:07.956,0:21:09.257 [自然模拟] 0:21:09.357,0:21:10.558 [光学模拟] 0:21:10.959,0:21:12.127 [谜题模拟] 0:21:12.894,0:21:14.062 [将图片转变成代码] 0:21:15.563,0:21:17.132 [将想法转变成3D模型] 0:21:20.068,0:21:21.569 [为画作加入3D效果] 0:21:23.671,0:21:25.039 [与AI共同创作] 0:21:25.273,0:21:26.141 [发型设计] 0:21:27.408,0:21:29.611 [给这只猫穿上礼服] 0:21:31.846,0:21:33.114 [在积攒了几十年的文件中搜索内容] 0:21:33.181,0:21:34.015 [菜谱] 0:21:34.883,0:21:36.417 [在数小时长的视频中搜索内容] 0:21:37.986,0:21:39.154 [建造机器人] 0:21:39.521,0:21:44.359 [直接说话就能编程][br]你能做个从我嘴里爆出一团圆形彩纸的特效吗? 0:21:45.360,0:21:46.628 我更新了草图 0:21:47.395,0:21:49.697 [万物皆可AI:娱乐、学习、动画、可视化][br][创造、转录、练习、翻译、查询、表情符号] 0:21:49.764,0:21:51.065 [混音、计算、探索、理解、地图、解释] 0:21:51.166,0:21:53.601 [生成千般内容][br][构想万种可能] 0:21:54.702,0:21:56.571 接下来我们做点什么? 0:21:56.971,0:21:58.973 这里还有30个创意供你参考 0:21:59.941,0:22:02.644 [使用Gemini开始构建][br][AI.Studio] 0:22:18.560,0:22:19.661 Demis,谢谢你! 0:22:20.195,0:22:23.231 很高兴能借此机会告诉大家 0:22:23.298,0:22:24.966 为了帮助像你一样的开发者 0:22:25.066,0:22:28.169 更轻松地使用Gemini 2.5进行构建 0:22:28.803,0:22:30.538 我们根据大家的反馈意见做出了多项改进 0:22:30.839,0:22:35.443 其中包括:功能改进、安全性和透明度加强 0:22:35.877,0:22:39.080 成本效益提升和可控性提升 0:22:40.281,0:22:44.485 首先,除了Demis提到的新版2.5 Flash之外 0:22:45.019,0:22:48.923 我们还推出了文字转语音功能的全新预览版 0:22:49.691,0:22:55.597 基于原生音频输出提供[br]同类产品中首创的多讲话人支持 0:22:55.797,0:22:57.799 可以支持两个人的语音 0:23:00.001,0:23:04.105 这意味着模型可以通过[br]更富于表现力的方式进行对话交流 0:23:04.305,0:23:07.442 能够捕捉我们言语表述之中的微妙之处 0:23:09.244,0:23:12.947 甚至能无缝切换到低声耳语,就像这样 0:23:14.716,0:23:17.318 它支持超过24种语言 0:23:17.552,0:23:20.588 甚至能流畅自如地在不同语言之间切换 0:23:22.323,0:23:26.361 模型可以在最初讲英语,然后 0:23:27.862,0:23:30.999 [印地语] 0:23:32.600,0:23:33.801 然后再切换回来 0:23:34.135,0:23:35.770 而且声音丝毫不变 0:23:36.838,0:23:38.239 不错吧? 0:23:44.846,0:23:47.115 从今天开始,你就可以开始在Gemini API里 0:23:47.181,0:23:49.851 使用这种文字转语音功能了 0:23:55.089,0:23:57.458 今天稍后,Live API还将提供 0:23:57.558,0:24:02.630 2.5 Flash原生音频对话功能的预览版 0:24:03.264,0:24:08.303 让你能通过更自然流畅的方式直接与Gemini会话 0:24:08.803,0:24:12.607 它甚至能区分讲话人与背景噪音 0:24:12.840,0:24:14.409 从而判断合适的回复时机 0:24:15.276,0:24:17.745 Logan和Paige将在开发者主旨演讲中分享更多内容 0:24:19.647,0:24:20.515 其次 0:24:21.115,0:24:24.986 我们加强了针对间接提示注入等安全威胁的防护 0:24:25.520,0:24:29.624 让Gemini 2.5成为我们迄今为止最安全的模型 0:24:30.692,0:24:33.428 在2.5 Pro和Flash模型中 0:24:33.695,0:24:35.897 我们都添加了思考总结功能 0:24:35.964,0:24:38.199 可以通过Gemini API和Vertex AI来使用 0:24:39.200,0:24:42.203 思考总结功能会提取模型的原始思考过程 0:24:42.370,0:24:46.774 将其整理为清晰有序的格式,包含标题、重要细节 0:24:47.041,0:24:49.444 以及有关模型操作的信息,比如工具调用 0:24:50.311,0:24:53.681 这能让你更清晰地了解模型的思考过程 0:24:54.082,0:25:00.154 不但对高延迟任务特别有用,同时方便调试和使用 0:25:01.856,0:25:03.925 大家也呼吁提高模型处理效率 0:25:04.292,0:25:07.628 而现在,2.5 Flash的效率更胜以往 0:25:07.996,0:25:12.400 同等性能的情况下,使用的token更少 0:25:12.567,0:25:16.404 在实际测评中效率提升达22% 0:25:18.072,0:25:21.709 最后,我们为2.5 Flash引入了思考预算功能 0:25:21.976,0:25:25.480 让你能够在成本、延迟和输出质量之间取得平衡 0:25:25.713,0:25:27.548 由于大家的反响很好 0:25:28.082,0:25:31.319 我们将思考预算功能添加到了2.5 Pro之中 0:25:31.619,0:25:35.556 并将在未来几周内随同我们的正式版模型一同发布 0:25:36.557,0:25:37.692 借助思考预算功能 0:25:37.759,0:25:41.095 你可以更好地掌控模型使用多少token进行思考 0:25:41.162,0:25:42.130 然后再给出回答 0:25:42.730,0:25:44.732 也可以直接关闭思考功能 0:25:46.734,0:25:48.503 之前Demis提到过 0:25:48.870,0:25:51.806 Gemini 2.5 Pro有着超强的编码能力 0:25:52.306,0:25:57.078 所以接下来,我想展示一下如何将构思落地 0:25:58.646,0:26:02.917 如果你参观过纽约市的美国自然历史博物馆 0:26:03.284,0:26:05.586 一定记得那里精彩的展品 0:26:06.120,0:26:07.688 为了让大家能够看到这些展品 0:26:07.755,0:26:10.591 我让2.5 Pro在Google AI Studio中 0:26:10.691,0:26:12.360 编写了一个简单的Web应用 0:26:12.527,0:26:14.295 用于分享一些照片以及详细信息 0:26:15.329,0:26:16.898 这是该应用目前为止的模样 0:26:18.032,0:26:20.768 不过我还想进一步加强其互动性 0:26:21.169,0:26:23.171 我还在就设计思路集思广益 0:26:23.538,0:26:24.972 不过已经有了一些想法 0:26:25.873,0:26:27.842 大家都看到过像这样的情况吧? 0:26:28.376,0:26:29.343 某人找到你 0:26:29.410,0:26:32.213 给你看在餐巾纸上勾勒出的“绝妙”点子 0:26:33.281,0:26:35.716 作为PM,我常常就是拿着餐巾纸的这个人 0:26:37.785,0:26:40.288 常规的二维网页设计已经不简单 0:26:40.655,0:26:42.557 但我想进一步实现三维设计 0:26:43.791,0:26:46.427 我知道转为三维并不容易 0:26:46.928,0:26:49.831 需要学习许许多多新知识 0:26:50.098,0:26:54.569 比如设置场景、相机、光线等 0:26:55.670,0:26:58.406 但幸运的是,2.5 Pro可以帮到我 0:26:59.107,0:27:00.942 这里我要做的是 0:27:01.576,0:27:06.447 把刚才展示的球体图片添加进来 0:27:08.950,0:27:14.222 输入提示,让2.5 Pro根据此图片更新我的代码 0:27:15.456,0:27:17.692 我们让2.5 Pro开始工作 0:27:17.758,0:27:20.161 可以看到,它开始思考 0:27:20.528,0:27:24.198 并根据我的要求制定了一份计划 0:27:24.565,0:27:27.401 稍后会将其应用于我的原有代码库 0:27:28.402,0:27:30.304 Gemini是一种多模态模型 0:27:30.505,0:27:32.907 因此能理解这张抽象的球体草图 0:27:32.974,0:27:35.510 通过编程生成精美的三维动画 0:27:35.710,0:27:38.079 再将其应用于我的原有应用 0:27:38.980,0:27:40.581 此过程大概需要两分钟 0:27:40.648,0:27:44.485 为节省时间,我们将以类似烘焙节目的形式来展示 0:27:44.552,0:27:46.420 我直接切换到另外一个标签页 0:27:46.487,0:27:49.657 在这场主旨演讲开始之前,我运行了相同的提示 0:27:49.724,0:27:52.527 这就是Gemini生成的结果 0:28:00.935,0:28:04.739 我们把一张粗略的草图直接变成了代码 0:28:05.173,0:28:07.208 更新了多个文件 0:28:07.675,0:28:10.578 而且可以看到,它思考了37秒时间 0:28:10.745,0:28:12.747 你也可以看到它的思考变化过程 0:28:13.281,0:28:14.849 以及它更新了哪些文件 0:28:15.650,0:28:17.618 这一切都是在AI Studio中完成的 0:28:17.718,0:28:19.487 所以在完成原型设计之后 0:28:19.754,0:28:23.524 我就可以直接用Gemini API密钥部署代码 0:28:24.792,0:28:26.627 这是我们的最终版应用在Chrome中的效果 0:28:28.729,0:28:30.765 看看这些动画 0:28:32.099,0:28:36.871 我不需要有多精深的Three.js库知识 0:28:37.071,0:28:40.041 也不必钻研复杂的三维算法,就做成了这样的作品 0:28:40.641,0:28:43.377 如果要亲自动手来做,我可能永远也没法实现 0:28:43.711,0:28:47.882 但这里,我只用一张草图就做出来了 0:28:49.350,0:28:52.486 我可以利用多模态,让整个体验更加丰富 0:28:52.920,0:28:56.924 我用2.5 Flash给每张照片添加了一个问题 0:28:57.124,0:28:58.593 邀请你进一步了解相关信息 0:29:01.295,0:29:02.897 但如果它能说话会怎样呢? 0:29:04.398,0:29:06.601 这时我们就可以用到Gemini的原生音频功能 0:29:08.469,0:29:09.870 这是一只穿山甲 0:29:09.937,0:29:13.741 它的鳞片由角蛋白构成,就像你的指甲一样 0:29:14.875,0:29:16.978 哇!现在它支持语音功能了 0:29:17.712,0:29:21.649 你可以听到,如何在应用中添加富有表现力的音频 0:29:22.383,0:29:24.318 在分享更多内容之前 0:29:24.518,0:29:26.921 我想以另一个好玩的设计来结束演示 0:29:26.988,0:29:29.423 这也是通过2.5 Pro编码实现的 0:29:39.967,0:29:41.802 我们在Google AI Studio提供了起始代码 0:29:41.869,0:29:44.305 让大家都可以在本演示的基础上进行二次开发 0:29:44.405,0:29:45.506 欢迎大家去尝试 0:29:46.641,0:29:48.409 这个演示仅仅是一个例子 0:29:48.709,0:29:51.912 证明Gemini 2.5必将大幅改变我们的构建方式 0:29:51.979,0:29:54.548 改变你利用非凡的功能 0:29:54.882,0:29:59.587 在自己的应用中集成视觉、语音和编码的方式 0:30:00.588,0:30:04.258 你可以在自己喜爱的IDE平台 0:30:04.892,0:30:06.727 以及各种Google产品中使用2.5 Pro 0:30:06.894,0:30:11.732 例如Android Studio、Firebase Studio[br]Gemini Code Assist 0:30:12.066,0:30:15.336 以及我们最新的异步编码智能体Jules 0:30:22.476,0:30:25.513 你只需提交任务,剩下的就交给Jules来处理 0:30:25.746,0:30:28.149 修复bug,执行更新 0:30:28.516,0:30:31.519 它与GitHub集成,可以独立运行 0:30:32.620,0:30:35.389 Jules能够处理大型代码库中的复杂任务 0:30:35.456,0:30:36.891 这些任务过去需要数小时才能完成 0:30:37.158,0:30:39.660 比如更新较早版本的Node.js 0:30:40.261,0:30:44.799 它能在几分钟内完成规划步骤、修改文件等任务 0:30:45.499,0:30:47.468 今天,我很高兴地宣布 0:30:47.535,0:30:49.270 Jules将开启公开Beta版测试 0:30:49.537,0:30:52.173 所有人都可以通过jules.google注册 0:30:59.146,0:31:03.484 正如Demis所说,我们一直在创新优化模型的方法 0:31:04.051,0:31:06.821 包括提高模型的效率和性能 0:31:07.588,0:31:12.793 我们率先采用扩散技术,革新了图像和视频的生成 0:31:13.461,0:31:18.199 扩散模型可通过逐步优化噪声来生成输出 0:31:19.066,0:31:23.938 现在,我们正借助最新研究模型将扩散应用于文本 0:31:25.172,0:31:27.508 这样有助于提升处理编辑等任务的能力 0:31:27.675,0:31:30.010 包括在数学和编码等应用场景中 0:31:30.711,0:31:32.847 因为它不只是从左到右线性生成内容 0:31:33.247,0:31:35.182 还能够快速反复试验解决方案 0:31:35.549,0:31:38.152 并在生成过程中不断纠错 0:31:40.020,0:31:44.492 Gemini Diffusion是一种领先的文本扩散实验模型 0:31:44.992,0:31:49.730 利用并行生成技术,实现超低延迟 0:31:50.531,0:31:54.335 例如,我们今天发布的Gemini Diffusion版本 0:31:54.869,0:31:56.804 生成速度是我们目前速度最快的模型 0:31:57.104,0:32:00.908 2.0 Flash-Lite的五倍 0:32:01.308,0:32:03.377 而编码能力却旗鼓相当 0:32:04.078,0:32:05.613 以这个数学问题为例 0:32:05.946,0:32:07.248 准备,开始! 0:32:09.450,0:32:10.718 眨眼间整个过程就完成了 0:32:17.558,0:32:22.830 之前我们加快了速度,但这次我们会放慢一点 0:32:27.868,0:32:31.338 看到模型如何一步步计算出39这个答案,感觉很棒 0:32:32.907,0:32:35.176 此模型目前正在小范围测试 0:32:36.243,0:32:38.712 我们会继续探索各种方法 0:32:38.813,0:32:41.182 降低所有Gemini模型的延迟 0:32:41.549,0:32:44.652 并即将推出速度更快的2.5 Flash-Lite模型 0:32:45.920,0:32:48.322 更多有关Gemini未来发展的信息 0:32:48.622,0:32:49.790 请Demis与大家进一步分享 0:32:58.065,0:32:59.099 谢谢你,Tulsi 0:32:59.767,0:33:04.772 我们一直在不懈探索Gemini 2.5思考功能的边界 0:33:05.639,0:33:07.975 使用AlphaGo的经验告诉我们 0:33:08.108,0:33:11.645 给模型更多思考时间,其回答质量会得到改善 0:33:13.013,0:33:16.183 如今,我们进一步优化了2.5 Pro 0:33:16.250,0:33:19.720 引入了名为Deep Think的新模式 0:33:20.788,0:33:25.059 它能将模型性能发挥到极致,带来突破性的成果 0:33:25.526,0:33:30.097 Deep Think采用了思考与推理领域的前沿研究 0:33:30.297,0:33:32.166 包括平行技术 0:33:33.200,0:33:35.903 目前为止,我们看到的性能堪称惊艳 0:33:36.437,0:33:39.773 在目前难度最高的数学基准测试USAMO 2025中 0:33:40.207,0:33:42.810 它的评分十分亮眼 0:33:43.210,0:33:44.712 在LiveCodeBench中也处于领先水平 0:33:44.778,0:33:48.082 这是一项针对竞赛级编码的高难度基准测试 0:33:48.549,0:33:51.652 Gemini从一开始就具备原生多模态能力 0:33:52.086,0:33:56.156 所以自然在衡量此能力的主要基准中表现同样出色 0:33:56.490,0:33:57.725 这一基准是:MMMU 0:33:59.159,0:34:02.596 因为我们正在通过2.5 Pro Deep Think来引领前沿技术 0:34:03.063,0:34:07.034 我们需要额外花一些时间来进行更多前沿安全评估 0:34:07.368,0:34:09.570 并从安全专家那里获取更多意见 0:34:10.237,0:34:12.439 因此,我们将通过Gemini API 0:34:12.506,0:34:15.009 向可信测试员开放此功能 0:34:15.509,0:34:18.212 以便在大规模推出此功能前获取反馈意见 0:34:19.146,0:34:22.049 今天稍后,Josh会更详细地给大家介绍 0:34:22.516,0:34:24.018 我们针对2.5 Pro Deep Think的计划 0:34:26.020,0:34:27.254 过去十年 0:34:27.454,0:34:30.658 我们为现代AI纪元的到来做了很多基础工作 0:34:31.959,0:34:34.995 从我们开创性地发明了Transformer架构 0:34:35.296,0:34:38.399 它如今已成为所有大语言模型的基础 0:34:38.699,0:34:41.569 到打造AlphaGo和AlphaZero等智能体系统 0:34:41.869,0:34:46.840 我们将继续拓展基础研究的深度和广度 0:34:47.308,0:34:49.109 探索下一个重大突破 0:34:49.176,0:34:52.379 满足人们对通用人工智能的需要 0:34:53.647,0:34:57.418 Gemini如今已是卓尔不凡的多模态基础模型 0:34:57.818,0:34:59.520 但我们依然脚步未停 0:35:00.054,0:35:02.289 竭力将其打造成所谓的“世界模型” 0:35:03.057,0:35:06.293 待到那时,它将能够通过模拟世界的方方面面 0:35:06.360,0:35:10.331 制定计划和构想全新体验,就像人类的大脑一样 0:35:11.165,0:35:13.634 这一直是我个人的热情所在 0:35:13.734,0:35:15.603 早在我为《主题公园》等模拟游戏 0:35:15.669,0:35:17.605 开发AI的早期职业生涯中 0:35:17.738,0:35:19.673 我就已经开始探索虚拟世界 0:35:21.008,0:35:23.711 多年来,我们一直向这个方向迈进 0:35:23.777,0:35:28.549 从训练智能体掌握围棋和《星际争霸》等复杂游戏 0:35:29.316,0:35:31.585 到最近推出的Genie 2模型 0:35:31.819,0:35:34.655 它仅通过一张图片作为提示 0:35:34.888,0:35:38.158 就能生成可交互的三维模拟环境 0:35:39.760,0:35:41.996 大家已经可以看到这些功能正在逐渐显现 0:35:42.129,0:35:44.765 例如Gemini能够运用对世界的认知和推理能力 0:35:45.132,0:35:46.600 来呈现自然万物 0:35:47.468,0:35:50.337 还有我们先进的视频模型Veo 0:35:50.404,0:35:52.873 它对基本物理规律有着深刻理解 0:35:53.040,0:35:56.010 比如重力、光线和材料的属性 0:35:56.777,0:35:58.646 Veo令人惊叹的地方在于 0:35:58.712,0:36:02.416 它能在所有帧中保持高度的准确性和连贯性 0:36:03.050,0:36:06.020 即使提示脑洞大开,它也知道该怎么做 0:36:06.387,0:36:09.256 比如这个用救生筏生成的人 0:36:11.392,0:36:15.362 理解物理环境对于机器人技术也至关重要 0:36:15.829,0:36:17.998 AI系统需要具备世界模型 0:36:18.132,0:36:20.334 才能在现实世界中高效地运作 0:36:21.602,0:36:24.505 我们微调了一个专用模型,Gemini Robotics 0:36:24.571,0:36:26.640 它可以教机器人完成各种实用任务 0:36:27.007,0:36:31.211 例如抓取物体、执行指令和动态适应新的任务 0:36:32.146,0:36:36.250 在场的各位,可以在AI展示区中体验这些机器人 0:36:43.157,0:36:45.359 将Gemini打造成完善的世界模型 0:36:45.426,0:36:48.462 对于解锁新型AI至关重要 0:36:49.530,0:36:51.699 比如能够为日常生活提供帮助的AI 0:36:51.965,0:36:54.835 智能且理解你所处情境的AI 0:36:55.102,0:36:58.839 以及能够跨设备为你制定计划并采取行动的AI 0:36:59.506,0:37:02.042 我们对Gemini应用的终极愿景 0:37:02.710,0:37:05.879 就是将其打造成一个通用型的AI助理 0:37:06.513,0:37:09.983 让它成为富有个性、主动思考、功能强大的AI 0:37:10.384,0:37:13.520 以及我们迈向通用人工智能的重要里程碑 0:37:14.254,0:37:18.392 这要从我们去年在Project Astra中[br]首次探索的功能开始 0:37:18.759,0:37:21.562 包括视频理解、屏幕共享和记忆等功能 0:37:22.663,0:37:27.167 过去一年,我们一直在将这些功能引入Gemini Live 0:37:27.701,0:37:29.436 以便更多人今天就能体验到 0:37:30.471,0:37:35.042 当然,我们也会不断改进,并探索新的前沿创新 0:37:36.210,0:37:40.280 比如通过原生音频升级语音输出,使其变得更自然 0:37:40.914,0:37:43.784 我们改进了记忆功能,并增加了计算机控件 0:37:44.151,0:37:45.018 我们来看一下 0:37:46.186,0:37:48.956 我现在向大家展示的是[br]Project Astra的最新研究原型 0:37:49.123,0:37:51.058 下面来看看它如何帮我修自行车 0:37:52.059,0:37:54.762 [Project Astra][br][行动智能+Gemini] 0:37:54.962,0:37:58.766 上网查查Huffy山地自行车的用户手册 0:38:00.100,0:38:01.969 已找到一份用户手册 0:38:02.169,0:38:03.437 你想要什么信息? 0:38:03.537,0:38:07.174 好,现在向下滚动页面,找到刹车系统的相关章节 0:38:07.441,0:38:09.510 好的,正在为你查找相应页面 0:38:10.177,0:38:12.045 这颗螺丝可能滑牙了 0:38:12.312,0:38:14.982 能否上YouTube找个修复教程视频? 0:38:15.449,0:38:17.618 没问题,正在打开YouTube 0:38:20.788,0:38:22.256 这个视频看起来不错 0:38:22.322,0:38:24.391 将橡皮筋套在螺丝头上 0:38:24.458,0:38:25.726 噢,不错,谢谢 0:38:25.793,0:38:27.828 查下我跟自行车店的往来邮件 0:38:27.895,0:38:30.264 看看我需要哪种规格的六角螺母? 0:38:30.464,0:38:33.567 好的,Bicycle Habitat的邮件显示 0:38:33.634,0:38:36.436 你的链轮需要一个3/8英寸的内六角螺母 0:38:36.503,0:38:38.305 我已经帮你标出了相应的工具盒 0:38:38.839,0:38:41.475 我好像需要一个备用的张力螺丝 0:38:42.009,0:38:44.411 能否联系最近的五金店确认是否有货? 0:38:44.611,0:38:46.280 好的,正在联系对方 0:38:46.547,0:38:48.715 稍后我会告诉你具体库存信息 0:38:48.782,0:38:50.684 我的刹车片有磨损了 0:38:50.818,0:38:52.085 麻烦再查一下用户手册 0:38:52.152,0:38:53.587 看看上面有没有提到刹车片? 0:38:53.720,0:38:56.757 用户手册的第24页显示 0:38:57.224,0:38:58.458 要去吃午饭吗? 0:38:59.193,0:39:00.961 好,再等我五分钟 0:39:01.595,0:39:03.130 你刚才说到哪了? 0:39:03.397,0:39:07.467 刚才说到,第24页第2节有相关说明 0:39:07.701,0:39:09.536 介绍了如何更换刹车片 0:39:09.636,0:39:11.405 之前说的那个电话有进展了吗? 0:39:12.072,0:39:14.241 嗯,我刚和五金店通完电话 0:39:14.408,0:39:16.543 他们确认张力螺丝还有库存 0:39:16.677,0:39:18.378 要我下一个自取订单吗? 0:39:18.879,0:39:22.316 能否展示几款适合我的自行车用的狗篮? 0:39:22.382,0:39:25.185 没问题,乐意效劳,稍等片刻 0:39:26.386,0:39:27.588 看看这几款怎么样 0:39:27.654,0:39:29.723 我觉得特别适合Zuco 0:39:31.391,0:39:32.426 [行动智能+Gemini] 0:39:32.492,0:39:37.331 [电脑控制/重点标示/通话助理/知识接地[br]原生音频/主动思考/聚焦讲话人/个性化购物] 0:39:40.567,0:39:44.538 通用AI助理将帮助我们处理各种任务 0:39:44.872,0:39:49.776 它会处理琐碎的行政工作[br]并给出令人愉快的新推荐 0:39:50.077,0:39:52.813 从而提高我们的效率,丰富我们的生活 0:39:53.447,0:39:57.284 我们正向可信测试员收集这些新功能的反馈意见 0:39:57.718,0:39:59.820 并致力于将它们引入Gemini Live 0:40:00.053,0:40:01.488 提供新的搜索体验 0:40:01.555,0:40:03.423 以及面向开发者的Live API 0:40:03.590,0:40:07.261 还有Android XR眼镜等全新形态的设备 0:40:07.861,0:40:09.730 今天后面还会有更详细的介绍 0:40:11.531,0:40:12.733 在我整个职业生涯中 0:40:12.799,0:40:15.569 核心都是关于如何利用AI来推动知识进步 0:40:15.636,0:40:17.371 以及加速科学发现 0:40:18.305,0:40:20.007 Google DeepMind长期以来都在致力于 0:40:20.073,0:40:23.710 将AI应用于近乎每个科学领域 0:40:24.244,0:40:25.512 仅在过去一年 0:40:25.679,0:40:28.515 我们就已经在多个领域取得了巨大突破 0:40:28.715,0:40:31.018 包括数学、生命科学等领域 0:40:31.952,0:40:33.120 我们构建了AlphaProof 0:40:33.353,0:40:36.390 它可以解决奥林匹克数学竞赛中银牌水平的问题 0:40:37.157,0:40:39.793 Co-Scientist,它可以与研究人员协作 0:40:39.893,0:40:42.462 帮助他们开发和测试新的假设 0:40:42.930,0:40:45.265 我们还刚发布了AlphaEvolve 0:40:45.432,0:40:49.336 它可以发现新的科学知识,并加速AI本身的训练 0:40:51.171,0:40:53.340 在生命科学领域,我们构建了AMIE 0:40:53.507,0:40:56.977 一个可以帮助临床医生进行医疗诊断的研究系统 0:40:57.544,0:40:58.612 AlphaFold 3 0:40:58.879,0:41:02.783 能够预测所有生命体的分子结构和相互作用 0:41:03.383,0:41:06.186 以及Isomorphic Labs,它以AlphaFold为基础 0:41:06.253,0:41:10.424 致力于用AI来革新药物研发流程 0:41:11.258,0:41:14.061 未来有望帮助攻克多种全球性疾病 0:41:15.395,0:41:16.830 短短几年时间 0:41:17.030,0:41:20.467 AlphaFold就已经在科学界产生了深远影响 0:41:20.968,0:41:23.937 它已成为生物学及医学研究的标配工具 0:41:24.371,0:41:26.506 全球超过250万的研究人员 0:41:26.573,0:41:28.775 正在其关键工作中使用这一工具 0:41:29.943,0:41:32.346 在发展通用人工智能的道路上 0:41:32.746,0:41:36.283 我始终坚信,如果以安全和负责任的方式进行 0:41:36.350,0:41:39.019 AI有望加速科学发现进程 0:41:39.286,0:41:42.622 并成为有史以来最有益的技术 0:41:50.197,0:41:54.935 回想起来,真是不可思议,就在几年前 0:41:55.135,0:41:59.506 大家今天看到的这些尖端技术还跟魔法一样 0:42:00.640,0:42:05.979 看到这些技术为搜索和Gemini等产品的新体验赋能 0:42:06.079,0:42:09.049 并且共同在日常生活中帮助人们,真是令人兴奋 0:42:09.816,0:42:12.486 例如,我们最近与Aira建立了合作关系 0:42:12.786,0:42:17.624 这家公司帮助盲人和低视力人群探索世界 0:42:17.858,0:42:19.459 方法是将该人群通过视频 0:42:19.526,0:42:21.461 与人工“视觉翻译”连接起来 0:42:22.262,0:42:23.530 利用Astra技术 0:42:23.697,0:42:27.801 我们设计了一个帮助更多人获得此类协助的原型 0:42:28.869,0:42:30.670 我们正在持续收集用户反馈 0:42:30.837,0:42:35.642 同时Aira的翻译人员也在积极监督安全性及可靠性 0:42:42.015,0:42:44.851 凭借这项技术以及我们所有的开创性工作 0:42:45.052,0:42:48.989 我们正在打造更具个性、更主动、更强大的AI 0:42:49.589,0:42:53.193 从而丰富我们的生活、加速科学进程 0:42:53.427,0:42:57.664 并开启一个充满发现和奇迹的黄金时代 0:43:02.135,0:43:05.872 我记得我小时候经常弹吉他到天黑 0:43:05.939,0:43:09.509 来证明即使我看不见,也可以弹吉他 0:43:11.678,0:43:16.049 我在大概四岁左右被诊断出患有视网膜色素变性症 0:43:16.149,0:43:19.086 我的视力水平不断恶化 0:43:20.153,0:43:25.258 但面对视力逐渐模糊的现实 0:43:25.559,0:43:29.329 音乐便是我的解药 0:43:29.729,0:43:32.299 玩音乐让我倍感自由 0:43:33.533,0:43:36.703 如果Project Astra能助我更独立地生活 0:43:36.770,0:43:39.272 那真是再好不过了 0:43:42.876,0:43:44.911 就拿旅游来说,我非常喜欢旅游 0:43:44.978,0:43:49.149 因为可以走出去,去从未到过的地方,结识新朋友 0:43:49.216,0:43:51.952 但这确实变得越来越困难 0:43:52.052,0:43:53.086 你好 0:43:53.153,0:43:56.556 嗨,我来拍摄周围环境 0:43:56.623,0:44:00.060 你能告诉我这个绿色房间里有什么吗? 0:44:00.127,0:44:02.762 你面向的墙壁上贴有一个指示牌 0:44:02.829,0:44:06.199 写着“Wi-Fi network: TheGreyEagle” 0:44:06.266,0:44:08.335 密码是“livemusic” 0:44:08.401,0:44:12.172 非常感谢。你能告诉我麦克风架在哪儿吗? 0:44:12.239,0:44:13.473 没问题,非常乐意为你提供帮助 0:44:13.540,0:44:15.342 我可以打开你的手电筒吗? 0:44:15.442,0:44:16.476 当然可以 0:44:18.178,0:44:20.480 这面墙上有一些盘绕的电缆 0:44:20.547,0:44:23.783 视频右上方位置应该就是麦克风架 0:44:26.553,0:44:29.756 我能做的最有力量的事就是登上舞台 0:44:30.056,0:44:31.658 拿起吉他,尽情演奏 0:44:32.325,0:44:36.930 让人们意识到,看不看得见 0:44:37.164,0:44:38.598 残疾与否,并不能决定一切 0:44:38.832,0:44:41.501 如果Project Astra能助我一臂之力 0:44:41.568,0:44:42.869 我将全力支持它 0:44:44.070,0:44:45.472 祝你演出愉快 0:44:45.539,0:44:47.274 [前往goo.gle/AstraVI注册加入视觉翻译等候名单] 0:44:54.948,0:44:56.049 谢谢你,Demis 0:44:56.116,0:45:00.854 Project Astra在无障碍功能方面的潜力让人惊艳 0:45:01.755,0:45:03.523 这又是一个激动人心的例子 0:45:03.690,0:45:06.526 说明AI可以推动我们一直以来的使命 0:45:07.294,0:45:12.098 即:整理全球信息,让所有人都能访问并从中受益 0:45:12.766,0:45:15.936 要说最能体现我们使命的产品,非Google搜索莫属 0:45:16.469,0:45:20.507 正是因为搜索,我们几十年前就开始投资AI 0:45:21.007,0:45:23.410 也正是通过搜索,我们得以将AI的益处惠及大众 0:45:23.510,0:45:25.579 满足人类好奇心 0:45:26.379,0:45:29.149 Gemini模型正在让Google搜索 0:45:29.216,0:45:32.219 变得更智能、更真实、更个性化 0:45:33.253,0:45:36.790 我们取得了不俗的进步[br]AI概览就是一个绝佳的例证 0:45:37.324,0:45:39.359 自去年I/O大会推出以来 0:45:39.693,0:45:42.963 该功能已覆盖200多个国家/地区 0:45:43.029,0:45:45.632 每月服务超15亿用户 0:45:46.366,0:45:48.201 随着人们使用AI概览 0:45:48.401,0:45:52.405 我们发现他们对搜索结果更满意[br]并且搜索频率更高 0:45:53.073,0:45:55.875 在我们的主要市场,如美国、印度 0:45:56.309,0:46:00.347 在AI概览的推动下,查询类型 0:46:00.413,0:46:01.915 实现了超过10%的增长 0:46:02.616,0:46:07.520 最令人振奋的是,这种增长势头与日俱增 0:46:08.054,0:46:12.325 这是搜索领域过去十年最成功的产品之一 0:46:20.033,0:46:24.938 AI概览也是推动Google智能镜头[br]视觉搜索增长的最强劲动力之一 0:46:25.772,0:46:28.675 智能镜头的搜索量同比增长65% 0:46:29.042,0:46:32.946 今年已有超千亿次视觉搜索 0:46:33.580,0:46:35.482 在我们最新的Gemini模型发布后[br]不仅用户查询量显著增加 0:46:35.982,0:46:40.887 而且他们还在尝试更为复杂的查询 0:46:40.954,0:46:43.390 AI概览达到了用户期待的 0:46:43.456,0:46:46.259 搜索质量与准确程度 0:46:46.559,0:46:48.795 并拥有行业领先的响应速度 0:46:49.429,0:46:52.465 为满足端到端AI搜索体验需求 0:46:52.899,0:46:55.969 我们正推出全新AI模式 0:46:56.469,0:47:01.041 这是对搜索的全面重构[br]同时搭配更先进的推理能力 0:47:01.441,0:47:06.579 你可以向AI模式提出更长、更复杂的查询[br]就像这样 0:47:07.247,0:47:13.987 实际上,用户查询长度已是传统搜索的2到3倍 0:47:14.354,0:47:17.424 而且我们支持多轮追问 0:47:18.024,0:47:22.562 所有这些今天正式上线[br]将作为新标签页整合到搜索中 0:47:23.163,0:47:27.067 我个人高频使用后发现[br]它彻底改变了我的搜索方式 0:47:27.400,0:47:30.804 很高兴宣布AI模式今日起 0:47:30.870,0:47:33.006 面向全美用户开放 0:47:39.579,0:47:43.750 AI模式将率先为Google搜索[br]引入我们的前沿技术 0:47:44.117,0:47:50.790 本周起,我们最智能的模型系列Gemini 2.5[br]将接入Google搜索 0:47:51.124,0:47:52.525 带来更丰富的功能 0:47:52.826,0:47:53.893 接下来有请Liz 0:48:05.772,0:48:06.940 Sundar,谢谢 0:48:07.440,0:48:12.345 短短一年时间[br]用户使用Google搜索的方式就发生了巨大变化 0:48:13.079,0:48:17.417 以前,用户在Google上搜索时[br]常常会问这样的问题 0:48:18.418,0:48:22.021 但现在,用户的问题变成了这样 0:48:23.223,0:48:26.259 用户的问题更长,也更复杂了 0:48:26.893,0:48:29.829 正如Sundar刚才所说,问题数量也大大增加了 0:48:30.764,0:48:33.466 用户正在亲身体验AI赋能的搜索 0:48:34.000,0:48:37.537 我们将Gemini模型的先进功能 0:48:37.737,0:48:41.908 与Google搜索对网络和世界信息的深刻理解[br]结合在一起 0:48:43.042,0:48:45.445 现在,你会发现你可以提出任何问题 0:48:45.845,0:48:52.018 更智能、更个性化的代理式搜索功能[br]将可以处理你最棘手的问题 0:48:52.318,0:48:53.820 并帮助你完成任务 0:48:54.954,0:48:57.023 这就是Google搜索的未来 0:48:57.424,0:49:00.660 它将超越信息本身,变得越来越智能 0:49:01.861,0:49:05.598 大家已经开始看到AI概览将这一切变为现实 0:49:05.832,0:49:08.101 而AI模式更是将它们提升到了新高度 0:49:09.602,0:49:13.807 AI模式是以Gemini 2.5为核心的变革性搜索体验 0:49:14.707,0:49:19.179 它是我们功能最强大的AI搜索[br]能够应对任何问题 0:49:20.380,0:49:21.581 正如Sundar所说 0:49:21.648,0:49:26.820 从今天开始[br]我们将在美国全面推出AI模式 0:49:33.860,0:49:37.764 它会以新标签页的形式直接出现在搜索页面中[br]大家也可以从搜索栏进入AI模式 0:49:38.731,0:49:43.636 AI模式将带来我们最精华的AI功能 0:49:44.437,0:49:46.005 但还不止于此 0:49:46.072,0:49:48.141 从它可窥见未来的广阔前景 0:49:49.309,0:49:53.880 未来,我们将逐步推出大量AI模型、先进的功能 0:49:53.947,0:49:56.583 并会直接整合到核心搜索体验中 0:49:57.383,0:50:03.356 今天就是起点[br]我们带来了为AI模式和AI概览提供支持的模型 0:50:03.890,0:50:07.627 大家在搜索框中就可以直接提出最难的问题 0:50:08.761,0:50:10.763 今天,我们将带大家全面了解AI模式 0:50:10.830,0:50:13.566 看看它如何运作,如何变得越来越强大 0:50:14.467,0:50:15.635 尤其是在个人使用场景 0:50:16.035,0:50:19.539 深度研究、复杂分析、可视化 0:50:19.739,0:50:22.575 实时多模态以及购物新方式等方面 0:50:23.343,0:50:26.145 亮点很多,因为AI模式的功能很强大 0:50:26.679,0:50:32.519 下面,我们具体来说一下[br]首先,使用AI模式,你可以随心所欲地提问 0:50:32.852,0:50:35.622 大家可以看到,搜索功能会立即开始工作 0:50:36.356,0:50:40.093 生成回答,将所有信息整合在一起 0:50:40.627,0:50:44.764 包括你可能从未发现的内容和创作者的链接 0:50:44.831,0:50:48.935 以及包含评分等实用信息的商家和企业的链接 0:50:49.869,0:50:53.306 Google搜索使用AI动态地调整整个界面 0:50:54.007,0:50:58.745 灵活组合文字、图片、链接,甚至是地图 0:50:58.945,0:51:00.346 只为更好地回答你的问题 0:51:00.947,0:51:02.916 你可以追问,就像跟人对话一样 0:51:03.983,0:51:06.386 现在,AI模式不仅仅是提供信息 0:51:06.819,0:51:09.923 更将搜索带到了全新的智能水平 0:51:11.357,0:51:15.061 这一切之所以能实现[br]得益于称之为查询扇出的技术 0:51:16.095,0:51:20.233 其原理是[br]Google搜索会识别需要高级推理的问题 0:51:21.167,0:51:23.169 并调用定制版的Gemini 0:51:23.336,0:51:25.838 将问题分解为若干子主题 0:51:26.139,0:51:30.143 然后替你同时发起大量查询 0:51:30.743,0:51:35.815 它会在整个网络进行搜索,深度远超传统搜索 0:51:36.616,0:51:39.719 它还会利用我们所有的实时信息数据集 0:51:40.086,0:51:45.124 例如知识图谱、购物信息图谱[br]以及本例中涉及的本地数据 0:51:45.258,0:51:50.029 这其中包含地图社区中,5亿多贡献者的数据洞见 0:51:51.130,0:51:53.900 Google搜索会整合所有信息给出回答[br]并进行自我检查 0:51:54.400,0:51:57.337 确保符合我们对信息质量的高标准要求 0:51:57.971,0:52:02.175 如果发现任何不足,它会发起更多搜索来弥补 0:52:03.376,0:52:04.544 这意味着,在AI模式下 0:52:04.611,0:52:09.282 你只需搜索一次,就能快速获得所有这些信息 0:52:10.516,0:52:14.287 现在来看看AI模式即将增加的新功能[br]这些功能会先在实验室中进行测试 0:52:15.788,0:52:19.492 不久之后,AI模式将能根据你以往的搜索记录 0:52:19.859,0:52:23.229 提供个性化的建议,从而使回答更具针对性 0:52:24.063,0:52:27.800 你还可以选择关联其他的Google应用[br]首先是Gmail 0:52:28.901,0:52:30.937 我们称之为个人使用场景 0:52:31.137,0:52:34.207 关联之后[br]AI模式可以引入你的个人使用场景来提供帮助 0:52:35.108,0:52:38.177 现在,根据你最近的酒店预订和搜索记录 0:52:38.544,0:52:40.380 它能推断出你更喜欢户外的座位 0:52:41.114,0:52:43.616 由于你订阅了这些画廊简报 0:52:43.883,0:52:47.020 它就会推荐一些精彩的艺术展[br]方便你在当地停留期间参观 0:52:48.187,0:52:49.322 但还不止这些 0:52:49.789,0:52:52.859 如果你的航班和酒店确认邮件都在收件箱里 0:52:53.226,0:52:56.696 它还会推荐你在纳什维尔时刚好能参加的活动 0:52:56.929,0:52:58.698 推荐你在停留期间的周边好去处 0:53:00.066,0:53:03.836 你会发现,AI模式中的个人使用场景功能[br]可以将Google搜索变成为你量身定制的工具 0:53:04.404,0:53:06.873 专门为你提供推荐内容 0:53:07.740,0:53:09.442 这一切始终都由你掌控 0:53:09.909,0:53:12.645 你可以随时选择关联或解除关联 0:53:13.746,0:53:16.449 个人使用场景将于今年夏天在AI模式中上线 0:53:24.724,0:53:27.994 另外,我们将针对需要更深入解答的问题 0:53:28.561,0:53:31.764 为AI模式引入Deep Research功能 0:53:32.565,0:53:35.702 大家已经在使用Google搜索来剖析某个主题 0:53:36.069,0:53:38.304 而这项功能将研究的深度和广度又提升了一个级别 0:53:38.905,0:53:41.774 所以我们称之为Deep Search 0:53:42.709,0:53:45.945 Deep Search同样采用前面提到的查询扇出技术 0:53:46.312,0:53:47.480 但功能更强 0:53:47.780,0:53:51.718 它可以替你发起数十次甚至数百次搜索 0:53:52.452,0:53:55.621 它会对所有分散的信息进行分析推理 0:53:55.888,0:53:59.659 并在几分钟内生成一份[br]带有完整引用信息的专家级报告 0:54:00.660,0:54:02.361 报告中会包含网页链接 0:54:02.628,0:54:05.064 方便你进一步探索和采取行动 0:54:06.332,0:54:09.502 这是我们构建AI模式的核心理念 0:54:10.136,0:54:12.739 以及我们对搜索领域中AI运用的一贯思考 0:54:13.606,0:54:16.542 因为我们坚信,AI将成为Web有史以来 0:54:16.609,0:54:18.511 最强大的发现引擎 0:54:19.479,0:54:22.515 帮助人们发现网络中更多有价值的信息 0:54:23.149,0:54:25.685 找到令人惊叹且高度相关的内容 0:54:27.153,0:54:30.022 大家已经开始感受到搜索变得越来越智能 0:54:30.289,0:54:31.758 但精彩远不止于此 0:54:32.458,0:54:33.926 接下来,我把时间交给Rajan 0:54:33.993,0:54:36.896 他将介绍AI模式如何帮助他分析 0:54:37.497,0:54:39.766 他热爱的一个体育领域里的复杂数据 0:54:50.877,0:54:55.214 Liz,谢谢你!我是一个狂热的棒球迷 0:54:55.281,0:54:58.885 最近关于这种叫做“鱼雷球棒”的新型球棒[br]引起了很多讨论 0:54:59.352,0:55:00.853 为不太关注棒球的朋友解释一下 0:55:01.053,0:55:05.525 这是一种新型球棒[br]它的特点是将更多重量集中在最佳击球点 0:55:06.159,0:55:10.563 正如大家所见[br]我一直在研究这种球棒是否真的对比赛产生了影响 0:55:11.030,0:55:13.699 现在,我想知道数据会怎么说 0:55:14.133,0:55:15.434 于是,我向Google搜索提出了一个问题 0:55:15.501,0:55:19.338 请显示目前使用鱼雷球棒的知名球员 0:55:19.639,0:55:22.708 在本赛季和上赛季的打击率和上垒率 0:55:23.476,0:55:26.913 这个问题并不简单,包含了多重维度 0:55:27.313,0:55:30.283 Google搜索需要识别哪些是知名球员 0:55:30.550,0:55:33.753 谁在使用鱼雷球棒,并整合他们的赛季数据 0:55:34.821,0:55:38.658 但它马上给出了非常实用的回答[br]其中还有容易理解的表格 0:55:39.659,0:55:42.128 而且,数据新鲜、精准 0:55:42.328,0:55:46.199 因为它使用的是我们持续更新的体育数据 0:55:46.299,0:55:47.567 甚至精确到最近一次好球 0:55:48.568,0:55:50.903 Google搜索甚至还提供了重要的背景信息 0:55:51.070,0:55:53.472 比如“目前赛季仍处于早期阶段” 0:55:54.373,0:55:58.878 我继续追问:这些球员本赛季击出多少支本垒打? 0:55:59.378,0:56:01.848 瞬间就获得了一张图表 0:56:02.915,0:56:04.717 这正好印证了Liz刚才提到的 0:56:04.784,0:56:09.689 AI模式能够为每个回答动态生成合适的界面 0:56:10.489,0:56:14.594 Google搜索确定[br]最适合呈现这些信息的方式是图表 0:56:14.827,0:56:20.466 因此生成了图表[br]就像Google搜索里内置了一个专属体育分析师 0:56:21.400,0:56:26.138 针对体育和金融问题的复杂数据分析和可视化功能 0:56:26.205,0:56:27.673 将在今年夏天上线 0:56:34.247,0:56:38.985 说了这么多棒球,我都想去现场看比赛了 0:56:39.352,0:56:41.621 比如说,下一场就去看 0:56:42.221,0:56:45.191 但是,购买好票总是让人头大 0:56:45.858,0:56:47.894 这里很高兴地告诉大家 0:56:48.127,0:56:52.798 我们正将Project Mariner的代理式功能[br]整合到AI模式中 0:56:53.566,0:56:57.603 大家已经看到AI模式正变得更加智能和个性化 0:56:58.104,0:57:01.440 现在可以开始看到Google搜索正变得更加主动 0:57:02.074,0:57:06.312 它能帮我完成任务,但仍由我保持掌控权 0:57:06.846,0:57:07.680 我会告诉它 0:57:08.047,0:57:12.485 “找两张这周六红人队比赛下层看台的平价门票” 0:57:13.552,0:57:15.187 Google搜索启动查询扇出 0:57:15.521,0:57:19.625 同时扫描多个网站,分析上百个潜在的门票选项 0:57:20.159,0:57:24.864 按我提出的所有条件填写表单[br]不用我去做这些繁琐的工作 0:57:25.965,0:57:27.600 然后将所有信息汇总在一起 0:57:27.900,0:57:32.305 基于搜索结果进行推理,分析实时票价和库存 0:57:32.705,0:57:36.442 然后,像这样,任务就完成了 0:57:37.176,0:57:40.313 它给出了不错的门票选项,还有实用的背景信息 0:57:40.513,0:57:42.481 我可以在此基础上做出明智的决定 0:57:43.549,0:57:46.819 这些座位看起来视野良好,价格合理 0:57:47.653,0:57:49.655 Google搜索已代我完成了大量步骤填写这些信息 0:57:49.989,0:57:52.124 并提供了链接,引导我完成结账 0:57:53.192,0:57:54.327 定下这些门票 0:58:02.368,0:58:04.403 Google搜索很快将能够帮助处理这类任务 0:58:04.470,0:58:09.809 首先覆盖的是活动门票、餐厅预订和本地生活服务预约 0:58:12.111,0:58:15.081 接下来,让我们聊聊多模态技术 0:58:15.681,0:58:18.484 从多模态搜索这个概念还不怎么流行的时候 0:58:18.551,0:58:20.286 我们就一直是这个领域的方向引领者 0:58:20.820,0:58:24.757 回到2017年,我们就是在这个讲台上[br]宣布推出了Google智能镜头 0:58:24.957,0:58:29.228 此后我们不断优化,让所见即所搜更加便捷 0:58:29.929,0:58:33.199 只需用Google智能镜头拍照或使用圈定即搜 0:58:33.265,0:58:35.968 就能立即获得AI概览 0:58:36.435,0:58:37.636 Sundar刚才提到过 0:58:37.903,0:58:39.839 视觉搜索目前正呈现出燎原之势 0:58:39.905,0:58:42.174 今天我很激动地宣布 0:58:42.241,0:58:46.245 每月有超过15亿用户使用Google智能镜头 0:58:52.018,0:58:55.321 现在,我们正围绕多模态迈出重大的一步 0:58:55.588,0:59:00.192 将Project Astra的实时功能引入AI模式 0:59:00.860,0:59:04.797 想想那些对话交流一下,就会变得超级简单的问题 0:59:05.064,0:59:06.866 而且自己的意图还能得到准确的展示 0:59:07.400,0:59:09.368 比如家庭DIY维修 0:59:09.568,0:59:12.304 棘手的学校作业,或是学习新技能 0:59:12.872,0:59:14.607 我们称之为实时搜索 0:59:14.840,0:59:16.876 现在利用摄像头 0:59:17.043,0:59:20.212 Google搜索能随着用户来回走动 0:59:20.279,0:59:22.948 实时感知他们看到的画面,并提供有用信息 0:59:23.315,0:59:25.985 就像在与Google搜索进行视频通话 0:59:26.986,0:59:30.856 我有三个孩子,他们每分钟能问上百万个问题 0:59:31.223,0:59:33.259 随着暑假临近 0:59:33.426,0:59:37.263 我和团队决定对实时搜索进行终极测试 0:59:37.396,0:59:41.233 帮助我们和孩子们解决些新问题 0:59:41.967,0:59:45.871 上周末,我们与我的家人在家里录制了演示 0:59:45.971,0:59:46.806 一起看下吧 0:59:48.074,0:59:50.609 看起来你们准备做有趣的科学实验 0:59:50.676,0:59:53.145 好的。准备好了吗? 0:59:53.212,0:59:54.380 -好了[br]-好的 0:59:54.447,0:59:56.916 -你准备好开始实验了吗?[br]-好了 0:59:57.016,1:00:00.953 能猜出我要做什么实验吗?我有双氧水 1:00:01.020,1:00:02.288 洗洁精和酵母 1:00:02.354,1:00:04.356 你可能要做大象牙膏实验 1:00:04.423,1:00:06.892 我知道哪颗草莓可以吃了 1:00:06.959,1:00:09.195 我在想办法让遥控器工作 1:00:09.295,1:00:13.165 看来有人准备种下青豆幼苗 1:00:13.232,1:00:15.234 把压力调到每平方英寸50磅左右 1:00:15.301,1:00:16.902 但不要超过每平方英寸90磅 1:00:17.069,1:00:19.638 我混合了小苏打,接下来做什么? 1:00:19.705,1:00:22.641 看起来有人把手指伸进肉桂水里了 1:00:22.708,1:00:24.844 如何让实验更壮观? 1:00:24.910,1:00:26.846 可以尝试不同的催化剂 1:00:26.912,1:00:29.115 碘化钾是个好选择 1:00:29.482,1:00:30.916 哇!为什么会这样? 1:00:31.117,1:00:33.385 成熟的草莓也会有甜香味 1:00:33.452,1:00:36.222 顶部绿叶应新鲜、有活力 1:00:36.288,1:00:38.090 化学反应进行得很顺利 1:00:38.290,1:00:39.859 -太棒了!谢谢! 1:00:41.594,1:00:42.528 -再来一次可以吗? 1:00:42.595,1:00:48.134 小伙子,怎么洗掉衣服上的草莓渍? 1:00:48.567,1:00:51.203 尝试用一汤匙白醋 1:00:51.270,1:00:53.172 加半茶匙洗衣液 1:01:07.820,1:01:13.759 通过AI模式[br]我们正在带来全新Google智能购物体验 1:01:14.827,1:01:16.061 前面提到过 1:01:16.462,1:01:21.467 AI模式整合了网络信息和实时数据 1:01:21.867,1:01:26.405 在这种情况下[br]这意味着既可通过Google图片获得视觉灵感 1:01:26.939,1:01:32.845 又能获得购物信息图谱提供的[br]海量商品和零售商数据 1:01:33.279,1:01:38.584 其中包含超过500亿条持续更新的商品详情 1:01:39.451,1:01:41.887 我来演示一下这是如何实现的 1:01:42.488,1:01:46.125 我一直在为我的客厅寻找一块新地毯 1:01:46.559,1:01:50.329 因此,我给出提示:我家有一个浅灰色的沙发 1:01:50.462,1:01:53.265 想找一块能让房间看起来更明亮的地毯 1:01:54.266,1:01:56.802 我首先需要的是视觉灵感 1:01:57.770,1:02:02.341 Google搜索根据我的喜好[br]动态生成了一个可浏览的图片拼接图 1:02:02.741,1:02:06.478 并显示了一些可购买的商品 1:02:07.880,1:02:12.051 其中就有我常用品牌的地毯[br]以及风格更现代的选项 1:02:12.117,1:02:14.653 因为我经常搜索这类风格的物品 1:02:15.621,1:02:21.694 这些推荐虽好,但大多数在我家恐怕连一天都撑不过 1:02:23.162,1:02:24.263 于是我补充道 1:02:26.999,1:02:30.903 家里有四个活泼的孩子,他们经常带朋友来玩 1:02:32.204,1:02:35.608 Google搜索立刻意识到了那种杂乱的场面 1:02:36.242,1:02:41.313 于是推荐了采用耐用材质的短绒地毯或可水洗地毯 1:02:41.380,1:02:43.349 还附上了一些可直接购买的产品 1:02:44.617,1:02:46.452 不过我对地毯并不专业 1:02:46.518,1:02:50.222 好在Google搜索贴心地指出了需要考虑的事项 1:02:50.356,1:02:53.058 并提供了后续实用建议 1:02:54.093,1:02:59.265 原本需要几周的研究,现在只需几分钟 1:03:00.199,1:03:04.470 可以想象,这种全新的AI模式体验 1:03:04.803,1:03:06.972 对购物需求会有多实用 1:03:07.506,1:03:11.176 说到购物,我需要几件夏天穿的新裙子 1:03:12.011,1:03:14.480 Google搜索给了我一些不错的选择 1:03:14.880,1:03:20.052 但现在我遇到了经典网购难题 1:03:20.919,1:03:25.057 那就是完全不知道这些款式穿在我身上会是什么样 1:03:25.958,1:03:28.794 于是,我们将推出一项新的试穿功能 1:03:29.228,1:03:32.164 帮用户虚拟试穿 1:03:32.298,1:03:35.868 感受款式在身上的效果 1:03:36.902,1:03:38.404 我来实时演示一下 1:03:40.306,1:03:46.278 在一通搜索之后,我找到一条喜欢的蓝裙子 1:03:47.012,1:03:49.548 然后点击这个按钮试穿 1:03:49.615,1:03:54.219 系统提示我上传照片,并引导我进入相册 1:03:54.753,1:03:56.088 我有很多照片 1:03:56.155,1:04:00.225 于是打算选一张清晰的全身照 1:04:00.759,1:04:02.428 处理就开始了 1:04:03.696,1:04:07.232 在等待系统处理的时候[br]我想介绍下背后的技术原理 1:04:08.133,1:04:11.236 为了打造这种规模化运作的试穿功能 1:04:11.537,1:04:14.306 我们需要深度理解人体结构 1:04:14.707,1:04:16.775 及服装在人体上的呈现效果 1:04:16.842,1:04:20.312 为此,我们构建了一个专门针对时尚行业训练的 1:04:20.512,1:04:22.881 定制图片生成模型 1:04:23.949,1:04:25.150 哇,处理完成了! 1:04:33.992,1:04:37.529 必须说实时演示成功的感觉太棒了 1:04:40.399,1:04:42.134 我们来继续聊背后的原理 1:04:42.334,1:04:45.304 该技术整合了先进的3D形体理解能力 1:04:45.838,1:04:49.775 能更精准地感知形状与深度 1:04:49.942,1:04:52.678 从而更好地呈现人体轮廓 1:04:53.245,1:04:56.014 这种体验完全基于你的照片 1:04:56.081,1:04:59.952 而非预先拍摄的图片或跟你不像的模特 1:05:00.486,1:05:03.856 对于你心仪的服饰 1:05:04.056,1:05:10.863 AI模型能够呈现面料褶皱、延展和垂坠感 1:05:12.197,1:05:16.101 这是一项业内领先的技术,可大规模应用 1:05:16.168,1:05:18.103 借助它,我们能以直观的方式 1:05:18.370,1:05:22.808 呈现数十亿服装产品[br]在不同体型的人群身上的穿着效果 1:05:23.175,1:05:24.443 大家可以看到 1:05:24.576,1:05:28.247 这个功能让我真实感受到了裙子上身的效果 1:05:29.148,1:05:31.517 选好裙子后 1:05:31.817,1:05:35.120 Google搜索还能通过全新代理式结账功能 1:05:35.487,1:05:39.057 按目标价位帮我购买 1:05:39.324,1:05:41.827 现在回到这件裙子的页面 1:05:42.394,1:05:46.165 我想点击按钮,跟踪价格 1:05:46.865,1:05:48.667 选择尺码后 1:05:49.468,1:05:51.003 设定目标价[br]格 1:05:51.069,1:05:53.739 我打算设成50美元左右 1:05:56.375,1:05:57.976 跟踪功能马上启动 1:05:58.110,1:06:02.281 Google搜索现在将持续监测销售该裙子的网站 1:06:02.347,1:06:05.017 在价格降到位时通知我 1:06:05.117,1:06:08.554 现在我们退出实时演示 1:06:09.021,1:06:11.390 这里我施展一点魔法 1:06:11.657,1:06:13.826 假设价格现在降到位了 1:06:14.760,1:06:19.264 此时系统会推送类似画面中的通知 1:06:19.631,1:06:20.833 我确认购买后 1:06:21.200,1:06:25.704 结账智能体会将尺码和颜色合适的裙子[br]添加到购物车中 1:06:26.305,1:06:29.741 我可以选择核对所有支付与配送信息 1:06:30.142,1:06:32.878 或直接授权智能体完成购买 1:06:42.321,1:06:47.559 只需点按一下,Google搜索就能[br]使用Google Pay安全地代我完成购买 1:06:47.626,1:06:50.295 当然,从灵感激发到最终购买 1:06:51.296,1:06:53.832 整个流程全程由我主导 1:06:54.800,1:06:57.002 我们的全新智能功能 1:06:57.302,1:07:01.940 将最好的购物体验与顶尖AI技术[br]融合在了Google搜索中 1:07:02.674,1:07:05.811 全新可视化购物及结账功能 1:07:05.878,1:07:07.679 将在未来几个月内逐步推出 1:07:07.880,1:07:12.484 虚拟试穿功能即日起可在实验室版本中体验 1:07:20.158,1:07:21.560 现在把时间交还给Liz 1:07:29.868,1:07:32.671 感谢Vidhya!正如Sundar所说 1:07:32.838,1:07:35.941 本周晚些时候即将迎来重大升级 1:07:36.341,1:07:42.414 Gemini 2.5定制版将集成到AI模式和AI概览中 1:07:43.348,1:07:46.018 这意味着,Google搜索迎来了新篇章 1:07:46.685,1:07:49.354 受益于此,AI概览将会把AI的实用性 1:07:49.521,1:07:52.224 带给核心Google搜索体验的每一个用户 1:07:52.991,1:07:54.293 正如你今天所见 1:07:54.526,1:07:57.629 AI模式是一种彻底重构的AI搜索 1:07:58.263,1:08:01.567 集成了我们最前沿的AI特性和功能 1:08:02.401,1:08:05.537 我们很激动,Google搜索迎来了新篇章 1:08:05.904,1:08:10.909 毫不夸张地说,用户可以真正地问它任何事 1:08:11.677,1:08:13.979 从最简单到最棘手的问题 1:08:14.379,1:08:17.849 最深的研究、个性化购物需求 1:08:18.050,1:08:20.218 希望代劳的琐事 1:08:21.019,1:08:23.188 只需提问,即可获得响应 1:08:26.224,1:08:31.330 好戏开场!我的魅力自然流露 1:08:31.496,1:08:34.566 我的风格如此惊艳,让所有人都为之震撼 1:08:34.633,1:08:37.035 等等!我感觉妙不可言 1:08:38.236,1:08:41.106 来吧,展示你如何舞动[br]舞动、舞动,释放自我 1:08:41.173,1:08:43.008 我用崭新视角迎接挑战 1:08:43.208,1:08:45.043 将热情点燃,让全场沸腾 1:08:45.110,1:08:47.412 我们将激情调到最高点,就是这样,来吧! 1:08:47.479,1:08:48.981 舞动、舞动,释放精彩 1:08:49.114,1:08:50.515 来吧,尽情展现你的独特魅力 1:08:50.582,1:08:52.551 我还应该做些什么来让它更坚固? 1:08:52.618,1:08:56.188 为了让它更坚固[br]建议在设计中运用更多三角形结构 1:08:57.789,1:08:59.424 已经足够完美了 1:08:59.558,1:09:03.028 尽情沐浴在聚光灯下,因为你值得闪耀 1:09:03.528,1:09:07.466 F-A-B-U-L-O-U-S,每一天都光芒四射 1:09:07.532,1:09:09.234 想要就来追求,勇敢出击 1:09:09.301,1:09:12.971 无意冒犯,只为精彩舞动[br]舞动、舞动,释放精彩 1:09:13.138,1:09:17.042 我带来崭新的创意风格[br]将热情点燃,让全场沸腾 1:09:17.109,1:09:18.744 我们把热情推向极致 1:09:18.810,1:09:20.979 就是这样,舞动、舞动,释放精彩 1:09:21.213,1:09:23.782 来吧,尽情展现你的独特魅力,让我大声喊出 1:09:23.849,1:09:25.817 就是这样,太棒了! 1:09:27.052,1:09:29.087 舞动、舞动,释放精彩 1:09:29.154,1:09:31.189 我带来崭新的创意风格 1:09:31.256,1:09:33.025 将热情点燃,让全场沸腾 1:09:33.091,1:09:36.995 我们把热情推向极致[br]来吧,舞动、舞动,释放精彩 1:09:37.229,1:09:41.600 来吧,尽情展现你的独特魅力,光芒四射! 1:09:41.667,1:09:43.468 每一天都耀眼夺目 1:09:43.535,1:09:45.203 想要就来追求,勇敢出击 1:09:45.270,1:09:47.139 无意冒犯,只为精彩——等等! 1:10:01.720,1:10:04.423 多年来,人们一直致力于构建 1:10:04.489,1:10:08.593 一种不仅能给出回应,而且具有理解能力的AI助理 1:10:09.261,1:10:12.264 一个不仅仅等待用户提问,而是能够提前预判需求的助理 1:10:12.731,1:10:16.234 一个真正能为用户赋能的通用助理 1:10:16.935,1:10:20.338 今天,我们正朝着这个方向迈出新步伐 1:10:20.572,1:10:22.974 而Gemini应用正是我们实现这一目标的工具 1:10:23.942,1:10:30.849 我们的目标是将Gemini打造成[br]最个性化、最主动、最强大的AI助理 1:10:31.249,1:10:33.585 而这一切始于个性化 1:10:34.953,1:10:38.924 如果你的AI助理真正属于你[br]完全为你定制,会怎样? 1:10:39.324,1:10:44.496 它能学习你的特点、你的偏好[br]你的项目、你的生活场景 1:10:44.963,1:10:46.898 而你始终处于主导地位 1:10:47.499,1:10:49.468 在你授权的情况下 1:10:49.534,1:10:52.337 你可以与它分享你所有的Google信息 1:10:52.571,1:10:54.372 使其成为你的延伸 1:10:55.040,1:10:57.442 我们将这项功能称为“个人使用场景” 1:10:57.809,1:11:01.913 我们已经实现了让用户与Gemini分享搜索记录 1:11:02.047,1:11:05.417 这样它就能知道用户曾经搜索过哪些食谱 1:11:05.517,1:11:07.619 并据此生成这样的回答 1:11:08.487,1:11:10.255 很快,你还可以添加 1:11:10.322,1:11:13.492 你在各种Google服务中的更多个人使用场景 1:11:13.558,1:11:16.928 让Gemini为你提供专属帮助 1:11:17.662,1:11:19.531 如果你选择启用这个功能 1:11:19.598,1:11:21.600 将始终掌控自己的体验 1:11:22.134,1:11:24.136 启用后,你可以随时查看和管理自己的信息 1:11:24.202,1:11:27.005 关联或解除关联各种Google应用 1:11:27.973,1:11:33.011 这种个性化将孕育主动型AI助理 1:11:33.411,1:11:35.046 带来革命性改变 1:11:35.847,1:11:38.517 要知道,目前大多数AI都是被动反应式的 1:11:38.817,1:11:40.619 你问一句,它答一句 1:11:41.052,1:11:43.522 但如果它能预见即将发生的事情 1:11:43.588,1:11:46.658 在你问它之前就帮你做好准备呢? 1:11:47.459,1:11:48.860 假设你是一名学生 1:11:49.027,1:11:50.896 你的物理考试即将来临 1:11:50.962,1:11:52.564 Gemini能提前一周在你的日历上圈出这场考试 1:11:52.631,1:11:55.500 而不是让你手忙脚乱地准备 1:11:55.901,1:11:57.469 它并不只是提醒你而已 1:11:57.769,1:12:00.105 它会为你提供个性化测验 1:12:00.505,1:12:02.140 这些测验整合了你的课堂材料 1:12:02.207,1:12:05.443 教授的讲义,甚至是你手写笔记的照片 1:12:06.011,1:12:07.379 这不仅仅是有用 1:12:07.579,1:12:09.181 这会让人感觉就像魔法一样神奇 1:12:09.981,1:12:11.817 再更进一步 1:12:12.083,1:12:13.985 设想Gemini能够基于你的兴趣 1:12:14.085,1:12:18.056 制作个性化讲解视频 1:12:18.323,1:12:20.492 帮助你更好地理解学习主题 1:12:21.426,1:12:24.296 例如,Gemini了解到我喜欢骑行 1:12:24.462,1:12:29.467 它就会用自行车相关的类比来为我讲解热力学原理 1:12:30.368,1:12:32.270 这就是Gemini的发展方向 1:12:32.470,1:12:34.306 而这一切之所以成为可能 1:12:34.539,1:12:37.676 都要归功于底层模型的强大能力 1:12:38.643,1:12:42.447 上个月,我们发布了最新的Gemini 2.5 Pro模型 1:12:42.581,1:12:45.283 这不只是一次升级,而是一次飞跃 1:12:45.784,1:12:48.486 人们正在用它创造出非凡的成果 1:12:48.920,1:12:50.322 他们不仅仅是进行氛围编程 1:12:50.388,1:12:54.759 而是能在几分钟内创造出[br]完整的游戏和功能齐全的网站 1:12:55.327,1:12:57.629 他们只需要在脑海中构思,就能让创意变为现实 1:12:58.163,1:13:00.999 而且这很有趣,无论是第一次编写软件 1:13:01.066,1:13:05.237 还是使用Veo模型创建视频,或者生成和编辑图像 1:13:05.403,1:13:07.372 这些技能现在成了每个人都能掌握的“超能力” 1:13:07.572,1:13:13.245 因此,个性化、主动性、强大功能 1:13:13.578,1:13:15.881 这三个方面是AI辅助的前沿领域 1:13:15.947,1:13:17.749 而借助Gemini 2.5 Pro 1:13:17.816,1:13:20.252 我们在这三个方面都取得了重大进展 1:13:21.453,1:13:23.221 接下来,我们来详细了解一下 1:13:23.288,1:13:26.157 这些功能如何在Gemini应用中实现 1:13:26.458,1:13:28.159 我们今天将推出五项新功能 1:13:28.727,1:13:30.996 首先,我们来看看Gemini Live 1:13:31.730,1:13:36.334 许多用户对其自然流畅的交互和对话方式赞不绝口 1:13:36.468,1:13:40.605 它支持150多个国家/地区的45种以上的语言 1:13:40.872,1:13:43.308 它是如此直观、如此富有互动性 1:13:43.475,1:13:44.910 以至于用户与它的对话时长 1:13:44.976,1:13:48.513 是Gemini应用中文本对话的五倍 1:13:48.914,1:13:50.949 从我的个人经验来说 1:13:51.016,1:13:54.953 它非常适合在早上开车上班的路上[br]交流讨论、梳理思路 1:13:55.820,1:13:57.122 正如Sundar提到的 1:13:57.188,1:13:58.556 Gemini Live现在增加了 1:13:58.623,1:14:01.993 出色的相机和屏幕共享功能 1:14:02.327,1:14:03.461 而从今天起 1:14:03.528,1:14:05.497 你可以在Gemini移动应用中免费使用这些功能 1:14:05.563,1:14:07.232 并同时支持Android和iOS设备 1:14:13.538,1:14:14.639 在接下来的几周内 1:14:14.706,1:14:18.009 你将能够把Gemini Live连接到你喜爱的部分应用中 1:14:18.143,1:14:20.845 如日历、地图、Keep和Tasks 1:14:21.046,1:14:23.481 这样一来,你只需将摄像头对准邀请内容 1:14:23.548,1:14:27.252 就能让Gemini立即将其添加到日历中 1:14:27.819,1:14:31.923 或者,在面对室友手写的潦草购物清单时 1:14:32.157,1:14:36.361 Gemini Live能够将那些潦草的笔记[br]转换成Google Keep中的整洁列表 1:14:37.028,1:14:41.132 我们为Gemini Live规划了众多令人期待的新功能 1:14:41.399,1:14:45.337 这些功能正在刚才展示的Project Astra中进行原型设计 1:14:45.570,1:14:47.238 当这些功能成熟后 1:14:47.305,1:14:50.108 我们会在Gemini Live中推出,让所有人都能使用 1:14:51.242,1:14:54.312 由于Gemini和Android合作紧密 1:14:54.379,1:14:56.081 这些创新功能中的大部分 1:14:56.147,1:14:59.751 会在整个生态系统中的Android设备上大放异彩 1:14:59.884,1:15:01.052 所以,敬请期待未来的更多更新! 1:15:02.253,1:15:07.092 实时交互确实很棒,但有时候,你需要深入挖掘 1:15:07.359,1:15:09.294 梳理一些复杂的内容 1:15:09.627,1:15:11.730 这就是Deep Research的用武之地 1:15:11.997,1:15:14.766 从今天起,你可以在使用Deep Research时 1:15:14.833,1:15:18.069 上传自己的文件来指导研究智能体 1:15:18.336,1:15:20.839 这也是用户呼声最高的一项功能 1:15:21.339,1:15:25.410 很快,你还能够将Deep Research[br]与Google云端硬盘和Gmail连接 1:15:25.643,1:15:28.346 以便轻松地从中导入信息 1:15:29.147,1:15:32.217 假如你获得了一份精彩、翔实的研究报告 1:15:32.384,1:15:36.087 比如这份关于彗星在太空中运行轨迹的科学分析 1:15:37.022,1:15:41.359 但要如何才能让它变得易于理解又能吸引读者呢? 1:15:41.426,1:15:43.661 以及如何分享这些精彩内容呢? 1:15:44.429,1:15:46.164 这就是Canvas大显身手的时刻 1:15:46.297,1:15:49.434 Canvas是Gemini提供的交互式协同创作空间 1:15:49.968,1:15:51.403 现在借助Canvas 1:15:51.469,1:15:55.940 只需轻轻一点就能转换报告格式 1:15:56.241,1:16:00.045 你可以将它转换成动态网页、信息图、实用测验 1:16:00.311,1:16:02.947 甚至是支持45种语言的自定义播客 1:16:03.548,1:16:06.317 要想更进一步,你可以在Canvas中通过氛围编程 1:16:06.384,1:16:11.022 创建各种精彩内容,让它按照你的想法不断完善作品 1:16:11.556,1:16:14.092 直到创造出你脑海中的构想 1:16:14.626,1:16:17.262 例如,我们的一位Google同事 1:16:17.328,1:16:21.032 仅仅是描述了自己的构想,然后与Gemini展开协作 1:16:21.199,1:16:24.169 便创造出了这个精确的交互式彗星运行模拟 1:16:24.969,1:16:26.871 现在,你也可以分享这样的应用 1:16:26.938,1:16:30.842 让其他人也能一起查看、修改甚至二次创作 1:16:31.609,1:16:34.512 这种能够转化任何内容的能力 1:16:34.779,1:16:37.315 开创了使用Gemini的全新方式 1:16:38.783,1:16:41.586 今天,我们还将推出Gemini的另一种全新使用方式 1:16:42.120,1:16:44.422 Chrome中的Gemini 1:16:45.857,1:16:51.129 它将成为你在桌面端浏览网页时的AI助理 1:16:51.663,1:16:53.998 最棒的是 1:16:54.065,1:16:58.436 它能直接理解你当前浏览的页面内容 1:16:58.837,1:17:01.372 只要你想到任何问题,都能获得针对性的解答 1:17:01.906,1:17:05.243 我个人最喜欢用它来对比一长串的评价内容 1:17:05.310,1:17:06.945 比如这个露营网站 1:17:07.512,1:17:08.813 从本周开始 1:17:08.880,1:17:11.049 我们将向美国地区的Gemini订阅者 1:17:11.116,1:17:12.917 推出Chrome中的Gemini 1:17:20.391,1:17:23.328 至此,我们已经体验了测验、Gemini Live对话 1:17:23.394,1:17:25.497 学习了彗星和露营地的知识 1:17:25.663,1:17:27.332 现在,我们来创造一些内容 1:17:27.832,1:17:29.234 从今天起 1:17:29.400,1:17:33.471 Google旗下最先进、功能最强大的图像生成模型 1:17:33.805,1:17:35.306 正式在Gemini应用上推出 1:17:35.874,1:17:39.577 它叫做Imagen 4,这是又一次重大飞跃 1:17:44.215,1:17:49.988 生成的图像更加饱满,色彩更加细腻,细节更为精细 1:17:50.355,1:17:52.357 例如各种场景中的阴影层次 1:17:52.423,1:17:55.026 以及照片中栩栩如生的水滴效果 1:17:55.393,1:17:57.929 经过长期的研究 1:17:57.996,1:18:00.231 我可以肯定地说,这些模型生成的图像质量 1:18:00.465,1:18:05.003 已经实现了从“不错”到“出色”再到“惊艳”的飞跃 1:18:05.670,1:18:09.807 Imagen 4在文字和排版方面也有很大提升 1:18:10.241,1:18:13.344 之前的模型虽然能生成不错的图像 1:18:13.545,1:18:16.948 但在图像中加入文字时总会出现瑕疵 1:18:17.382,1:18:21.352 举个例子,假设我想创建一张音乐节海报 1:18:21.586,1:18:23.821 将那只Chrome恐龙作为主角 1:18:24.155,1:18:27.792 Imagen 4不仅能够准确呈现文本内容和正确拼写 1:18:27.859,1:18:30.461 它还能做出富有创意的设计决策 1:18:30.628,1:18:33.231 比如在字体中融入恐龙骨骼元素 1:18:33.298,1:18:37.135 调整文字间距、字号大小和整体布局 1:18:37.202,1:18:38.636 创造出这张很棒的海报 1:18:39.370,1:18:43.908 总之,图像质量更高、生成速度更快、文字效果更好 1:18:44.342,1:18:48.680 这样一来,你就可以制作海报、派对邀请函等内容 1:18:49.480,1:18:51.950 借助原生图像生成功能 1:18:52.016,1:18:54.919 你还可以直接在应用中轻松编辑这些图像 1:18:55.887,1:18:59.824 我们还开发了一个快速版本的Imagen 4 1:19:00.258,1:19:02.227 我们非常期待你能亲自体验它 1:19:02.293,1:19:06.431 它的速度是我们先前模型的十倍 1:19:06.497,1:19:09.100 让你能够快速尝试和完善各种创意 1:19:10.201,1:19:12.270 最后,我想向大家展示一项新内容 1:19:12.770,1:19:14.138 这些生成的图像的确很棒 1:19:14.472,1:19:18.910 但要讲述一个完整的故事有时需要动作和声音的配合 1:19:19.611,1:19:22.280 去年12月,我们发布的Veo 2模型 1:19:22.347,1:19:25.817 重新定义了整个行业的视频生成标准 1:19:26.217,1:19:29.654 如果你注意到了Demis昨天发布的煎炒洋葱视频 1:19:29.854,1:19:31.756 就能猜到我们还有更多新鲜出炉的惊喜 1:19:32.624,1:19:37.128 今天,我很高兴地宣布推出我们最先进的模型 1:19:37.528,1:19:38.663 Veo 3 1:19:45.803,1:19:49.040 与今天发布的其他内容一样 1:19:49.107,1:19:50.908 它从今天起就已开放使用 1:19:55.847,1:19:58.283 视觉质量更加出色 1:19:58.349,1:20:01.552 对物理规律的理解更加强大 1:20:01.753,1:20:07.425 但这次质的飞跃在于,Veo 3实现了原生音频生成 1:20:08.059,1:20:14.465 这意味着Veo 3能够生成音效 1:20:14.866,1:20:17.669 背景音,甚至对话 1:20:18.503,1:20:21.639 只需输入提示,你的角色就会开口说话 1:20:22.507,1:20:26.611 这是森林中一只睿智的老猫头鹰与一只紧张的小獾 1:20:27.011,1:20:27.879 敬请聆听 1:20:37.855,1:20:40.358 他们今天留下了一个球 1:20:40.425,1:20:42.493 它能弹得比我跳得还高! 1:20:43.494,1:20:45.596 这是什么神奇的魔法? 1:20:59.210,1:21:02.880 很酷吧?Veo不仅添加了森林的声音 1:21:02.947,1:21:04.282 还添加了对话 1:21:04.782,1:21:10.621 内容创作正在进入结合音频和视频生成的新时代 1:21:10.688,1:21:12.523 无论是画面还是声音都栩栩如生 1:21:12.890,1:21:15.126 让人感觉身临其境 1:21:15.193,1:21:19.297 在这个视频中,就像真的坐在这艘船上 1:21:21.132,1:21:22.867 这片海洋,是一股无与伦比的力量 1:21:22.934,1:21:25.103 一种未被驯服的野性力量 1:21:25.803,1:21:27.205 她指挥着你的每一次划桨 1:21:27.505,1:21:29.040 伴随着每一道破浪的闪光 1:21:36.647,1:21:40.184 如此逼真的画面、丰富的情感表达 1:21:40.251,1:21:43.921 匹配的口型,以及背景中的海洋 1:21:44.255,1:21:46.724 作为一款强大的创意工具 1:21:46.791,1:21:49.894 Veo的发展速度令人叹为观止 1:21:50.495,1:21:53.398 我们一直在与电影行业密切合作 1:21:53.464,1:21:56.467 共同探索Veo的可能性,直至做好发布的准备 1:21:56.534,1:21:58.803 稍后也将为大家分享更多具体内容 1:21:59.670,1:22:01.806 以上就是Gemini的更新内容 1:22:02.440,1:22:05.877 从今天起,Gemini Live的各项功能 1:22:06.010,1:22:08.446 在Android和iOS上完全免费提供 1:22:09.013,1:22:12.650 Deep Research和Canvas迎来了迄今为止最大的更新 1:22:13.317,1:22:14.619 正如之前介绍的 1:22:14.685,1:22:17.588 支持多步骤操作的Agent Mode也即将推出 1:22:18.089,1:22:21.559 我们推出了Chrome中的Gemini,帮助你浏览网页 1:22:21.859,1:22:24.095 你可以使用全新的Imagen 4和Veo 3模型 1:22:24.295,1:22:28.800 创建令人惊叹的图像和音画结合的视频 1:22:29.333,1:22:31.936 所有这些功能都将在Gemini应用中整合 1:22:32.003,1:22:38.342 助力我们打造最个性化、最主动、最强大的AI助理 1:22:38.976,1:22:41.045 接下来,Jason将为大家详细介绍 1:22:41.112,1:22:44.515 这些生成模型如何为创意表达开启全新可能 1:22:44.615,1:22:45.616 有请Jason 1:22:56.160,1:22:57.061 谢谢,Josh 1:22:58.262,1:23:02.066 无论你是创作者、音乐人还是电影制作人 1:23:02.500,1:23:05.570 生成式媒体技术正在拓展创意表达的可能性 1:23:06.337,1:23:09.640 通过与艺术家和创作者一直以来的密切合作 1:23:09.774,1:23:13.945 我们开发了能够赋能其创作过程的技术 1:23:14.612,1:23:19.083 例如,我们与音乐人合作开发了Music AI Sandbox 1:23:19.350,1:23:21.085 这是一款专为音乐专业人士设计的工具 1:23:21.152,1:23:22.687 让他们能够在创作过程中 1:23:22.753,1:23:25.556 探索我们的音乐生成模型Lyria所带来的可能性 1:23:26.357,1:23:29.927 例如这段视频记录了音乐传奇人物、格莱美获奖歌手 1:23:29.994,1:23:31.729 作曲家Shankar Mahadevan 1:23:31.796,1:23:34.832 使用Music AI Sandbox和Lyria的场景 1:23:36.400,1:23:40.771 我是Shankar Mahadevan[br]一名音乐作曲家、歌手、制作人 1:23:40.838,1:23:42.306 大家都说我笑口常开 1:23:45.076,1:23:46.644 使用Sandbox的体验非常棒 1:23:47.111,1:23:51.082 我们输入需求后,它生成了一段背景音乐 1:23:51.549,1:23:54.218 我们在此基础上创作出了完整的歌曲 1:23:58.523,1:24:01.158 对一名音乐人而言,这是一个极具启发性的工具 1:24:01.692,1:24:04.295 就像你打开一扇门,发现了另一个空间 1:24:04.362,1:24:06.998 然后再开一扇门,发现更多可能性 1:24:07.064,1:24:08.933 AI就是这样,不断开启新视野 1:24:35.192,1:24:36.027 太棒了 1:24:40.298,1:24:42.166 我们最近推出的Lyria 2模型 1:24:42.233,1:24:45.603 可以生成高保真音乐和专业级音频 1:24:46.170,1:24:47.672 它生成的音乐旋律优美动听 1:24:47.738,1:24:50.308 还能编入独唱和合唱人声部分 1:24:51.075,1:24:53.878 它能够创作出富有表现力且层次丰富的内容[br]例如接下来的这段音乐 1:25:11.362,1:25:13.631 Lyria 2从今天起正式向企业用户 1:25:13.698,1:25:16.033 和YouTube创作者和专业音乐人开放 1:25:17.268,1:25:21.339 这种协作理念不仅体现在我们构建的产品中[br]也体现在我们的构建方式上 1:25:22.173,1:25:24.141 目前,无论是个人还是组织 1:25:24.208,1:25:27.378 都难以有效识别AI生成的图像 1:25:28.245,1:25:33.684 随着技术的进步和生成的音乐[br]音频、图像、视频日益逼真 1:25:33.751,1:25:35.486 这一情况只会更加泛滥 1:25:36.287,1:25:39.023 因此,我们在这一领域持续创新 1:25:40.191,1:25:42.460 两年前,我们开创了SynthID技术 1:25:42.627,1:25:45.830 它能在生成的媒体内容中嵌入不可见的水印 1:25:46.397,1:25:50.935 到目前为止,已有超过100亿生成的内容带有水印 1:25:51.869,1:25:53.838 另外,我们也在进一步扩大合作伙伴关系 1:25:53.904,1:25:56.941 确保更多内容带有SynthID水印 1:25:57.008,1:25:59.510 同时让更多组织能够检测到水印 1:26:00.311,1:26:03.981 最后,我们还简化了水印的检测机制 1:26:04.348,1:26:06.684 我们新推出的SynthID检测器能够识别 1:26:06.751,1:26:11.088 图像、音频、文本或视频是否含有SynthID水印 1:26:11.155,1:26:13.791 即使只是部分内容被标记也能识别 1:26:14.925,1:26:17.628 这一功能从今天起开始向早期测试员逐步开放 1:26:24.201,1:26:26.971 凭借广泛的合作,我们还开始探索Veo 1:26:27.038,1:26:28.339 在电影制作领域的应用 1:26:29.073,1:26:32.810 最近,我们与极富远见的导演Darren Aronofsky 1:26:32.877,1:26:35.579 及其创新故事创作公司Primordial Soup达成了合作 1:26:35.846,1:26:38.783 共同探索如何塑造Veo的能力以满足创作需求 1:26:38.849,1:26:41.686 让艺术家引领技术创新方向 1:26:42.486,1:26:45.856 通过这一合作,我们将世界顶尖的视频生成模型 1:26:45.923,1:26:49.393 交付给最杰出的电影制作人,推动技术突破 1:26:49.460,1:26:52.763 打造更具创意性和情感表现力的创作工具 1:26:53.631,1:26:56.033 在计划制作的三部短片中 1:26:56.100,1:26:59.103 第一部作品是导演Eliza McNitt的《ANCESTRA》 1:26:59.537,1:27:00.504 现在就让我们来一睹为快 1:27:03.140,1:27:06.143 电影本质上是一种深刻的人类行为 1:27:06.210,1:27:08.312 它能将人们与彼此的故事联系起来 1:27:08.946,1:27:13.017 它能够将我们从自己的经历中抽离出来 1:27:13.084,1:27:14.985 带我们踏上另一段旅程 1:27:15.720,1:27:17.555 我认为这一点永远不会改变 1:27:18.155,1:27:22.426 这个故事虽然跨越整个宇宙的历史长河 1:27:23.060,1:27:25.162 但本质上讲述的是一位母亲的经历 1:27:25.229,1:27:28.733 以及当她那有心脏缺陷的孩子刚出生时所发生的一切 1:27:29.500,1:27:32.236 我们拍摄了演员真实的情感表演 1:27:32.303,1:27:36.974 但同时也通过AI生成了[br]那些用传统方式根本无法拍摄的画面 1:27:38.309,1:27:41.378 我想要婴儿紧握着母亲的手指那样的画面 1:27:41.879,1:27:43.314 展现他们之间那种幸福的时刻 1:27:43.380,1:27:44.215 是的 1:27:45.516,1:27:47.885 Veo是一个生成视频模型 1:27:47.952,1:27:49.954 但在我看来,它更像是一个全新的镜头 1:27:50.020,1:27:52.356 让我能够以不同方式想象身边的一切 1:27:53.424,1:27:55.292 探索这些模型的优势和局限 1:27:55.359,1:28:01.732 并尝试将它们打造成创作工具,这个过程非常有趣 1:28:03.567,1:28:07.505 老实说,我从未想过要讲述我出生那天的故事 1:28:07.772,1:28:09.173 但现在我们拍出来了 1:28:15.713,1:28:16.981 这原本只是一次普通的产检而已 1:28:17.047,1:28:18.349 紧急剖腹产! 1:28:19.183,1:28:20.284 胎儿有危险 1:28:20.351,1:28:21.252 我们这里需要帮助! 1:28:21.318,1:28:22.153 我们必须立刻手术 1:28:22.219,1:28:23.554 我的孩子能保住吗? 1:28:23.621,1:28:25.022 我们会尽一切努力 1:28:25.089,1:28:25.956 那我也会平安无事吗? 1:28:26.457,1:28:29.093 来自在你之前存在的每一个生命 1:28:30.394,1:28:35.366 来自为你的诞生而消亡的每一颗星辰 1:28:52.983,1:28:54.051 真是令人惊叹的杰作 1:29:01.192,1:29:03.594 Eliza巧妙地将真人实景表演 1:29:03.794,1:29:08.532 与Veo生成的内容,包括微观世界、宇宙景象 1:29:08.799,1:29:10.901 以及她自己作为新生儿的画面融为一体 1:29:11.735,1:29:15.306 这种方法开辟了全新的叙事可能性 1:29:15.372,1:29:17.708 使Eliza能够将宏大的电影视觉效果 1:29:17.775,1:29:20.578 和深厚的情感表达带入一个极为个人化的故事 1:29:21.679,1:29:24.615 这次合作也帮助我们塑造了Veo的功能 1:29:24.915,1:29:27.618 以满足像Eliza这样的故事创作者的需求 1:29:28.185,1:29:30.521 我们为电影制作人开发了多项新功能 1:29:30.588,1:29:32.089 所以当你创作视频时 1:29:32.156,1:29:33.824 无论你提供什么创作元素 1:29:34.024,1:29:38.195 角色、场景还是艺术风格[br]Veo都能确保它们在整个创作过程中保持一致性 1:29:38.896,1:29:40.631 你还可以像真正的导演一样指挥Veo 1:29:40.698,1:29:42.700 提供精确的相机指令 1:29:42.766,1:29:44.935 让它沿着特定路径拍摄 1:29:46.070,1:29:48.072 这些功能将帮助电影制作人 1:29:48.138,1:29:50.908 用Veo顺畅地表达自己的创意 1:29:51.876,1:29:53.978 而我们的创新并未止步于此 1:29:54.645,1:29:55.613 下面请Josh重返舞台 1:29:55.679,1:29:56.780 为大家介绍更多内容 1:30:04.922,1:30:05.890 谢谢,Jason 1:30:06.690,1:30:09.159 在与创意社区合作的基础上 1:30:09.326,1:30:13.597 我们为创作者打造了一款全新的AI电影制作工具 1:30:14.164,1:30:18.502 它结合了Veo、Imagen和Gemini三大技术的精髓 1:30:19.003,1:30:22.840 一款源自创作者、为了创作者打造的工具 1:30:23.574,1:30:26.443 它的设计灵感源自创作者那种 1:30:26.543,1:30:29.747 完全沉浸在创作中思如泉涌的奇妙境界 1:30:30.381,1:30:33.617 我们将这款工具命名为Flow,从今天起正式推出 1:30:34.318,1:30:35.586 我来给大家展示一下它的运作方式 1:30:38.055,1:30:40.157 我们来看看我正在创作的一个项目 1:30:40.357,1:30:42.293 故事的主角是一位老爷爷 1:30:42.359,1:30:45.562 他正在一位鸟类朋友的帮助下制造一辆会飞的汽车 1:30:46.096,1:30:47.364 这些是我的素材 1:30:47.531,1:30:49.533 这位老人和他的汽车 1:30:50.167,1:30:51.268 借助简便的界面 1:30:51.335,1:30:53.304 你可以轻松将自己的图像上传到工具中 1:30:53.504,1:30:56.206 或者,你可以使用内置的Imagen 1:30:56.273,1:30:57.608 即时生成所需的图像 1:30:58.275,1:31:02.746 只需简单描述就能生成一张定制金色变速杆图像 1:31:03.380,1:31:04.848 看,相当不错 1:31:05.749,1:31:09.653 接下来,你可以开始把所有这些素材组合起来 1:31:10.187,1:31:11.655 只需输入一条提示 1:31:11.722,1:31:15.659 你可以描述想要的效果,包括非常精确的镜头控制 1:31:16.293,1:31:18.963 Flow能将所有素材安排到恰当的位置 1:31:19.363,1:31:21.732 我可以在场景构建器中继续进行调整迭代 1:31:22.266,1:31:23.968 接下来是最精彩的部分 1:31:24.468,1:31:26.837 如果我想继续拍摄场景的下一个镜头 1:31:27.171,1:31:30.441 只要点一下这个加号,新镜头就自动生成了 1:31:31.008,1:31:33.577 我只需用文字描述接下来想要呈现的场景内容 1:31:33.844,1:31:36.513 比如在后座加上一只3米高的鸡 1:31:36.947,1:31:38.415 Flow将完成剩下的工作 1:31:39.016,1:31:42.152 角色将保持一致,场景也将保持一致 1:31:42.319,1:31:43.454 整个过程行云流水 1:31:43.654,1:31:47.124 如果对有些地方不太满意,也没关系 1:31:47.358,1:31:50.327 你可以像使用其他视频剪辑工具一样 1:31:50.494,1:31:52.963 随时返回剪掉那些不合适的片段 1:31:53.464,1:31:56.467 但Flow还支持反向操作 1:31:56.667,1:31:59.203 你还可以用它来延长素材片段 1:31:59.837,1:32:03.073 这样,我就得到了我一直追求的理想收尾镜头 1:32:03.941,1:32:07.344 所有片段制作完毕后,我可以把它们下载下来 1:32:07.544,1:32:10.314 然后把它们导入我常用的视频剪辑软件 1:32:10.381,1:32:12.349 再加上一小段Lyria生成的配乐 1:32:12.549,1:32:16.787 就这样,老爷爷终于开上了自己的“飞车” 1:32:40.077,1:32:41.645 简直太棒了 1:32:41.845,1:32:45.549 接下来,让我们听听几位新锐AI电影制作人的心声 1:32:45.616,1:32:48.218 他们在Flow的开发过程中为我们提供了宝贵意见 1:32:48.285,1:32:50.521 他们分享了自己使用Flow的感受 1:32:50.687,1:32:52.456 以及他们如何让这一工具变得更出色 1:32:52.689,1:32:53.657 一起来看看吧 1:32:57.194,1:32:59.329 我不知道自己是否走在正确的道路上 1:32:59.396,1:33:01.398 但一直在努力探索 1:33:01.665,1:33:05.569 我不断探索,不断质疑 1:33:05.636,1:33:08.138 直到某一刻,有些东西悄然改变 1:33:08.539,1:33:11.275 我不再纠结于正确与否,只是专注去做 1:33:13.811,1:33:19.316 然后,那些散落的拼图开始慢慢归位 1:33:23.387,1:33:25.622 我的思维变得非常清晰 1:33:26.323,1:33:30.661 无数种可能在我脑海中闪现 1:33:30.994,1:33:33.664 就像穿越时空般奇妙 1:33:33.730,1:33:35.632 当我以上帝视角审视身为创作者的自己 1:33:35.699,1:33:37.634 以及我所创作的不同世界中的角色 1:33:37.701,1:33:39.937 我感觉这些角色仿佛有着自己的生命 1:33:40.003,1:33:43.107 尽管我知道故事情节的走向由我掌控 1:33:43.774,1:33:45.609 似乎在某个时刻 1:33:45.676,1:33:47.945 这些故事开始沿着自己的脉络逐渐展开 1:33:48.712,1:33:53.283 你知道,你的故事可以有无数种结局 1:33:55.119,1:33:59.089 用Flow创作的作品不是简单的素材堆砌 1:33:59.957,1:34:03.494 它就像花园里的花,肆意绽放 1:34:04.561,1:34:09.066 它自然生长,充满生命力,浑然天成 1:34:10.167,1:34:11.768 我没有刻意去安排什么 1:34:11.835,1:34:15.005 那些画面只是在等着我找到它们 1:34:15.239,1:34:18.108 当我有这种感觉时,我就知道自己找对了方向 1:34:38.495,1:34:41.098 真是叹为观止,听到这些电影制作人讲述 1:34:41.165,1:34:43.267 如何将不可思议的想象变为现实 1:34:43.767,1:34:45.435 我们希望通过我们的工具 1:34:45.502,1:34:49.173 让大家都能享受这种自由构建、挥洒创意的感觉 1:34:49.840,1:34:51.475 所以我很激动地宣布 1:34:51.542,1:34:55.179 今天,我们将升级Google的两大AI订阅方案 1:34:55.512,1:34:57.581 我们将推出Google AI Pro 1:34:57.648,1:35:00.484 以及全新的Google AI Ultra 1:35:01.518,1:35:04.755 我们将面向全球推出Google AI Pro 1:35:04.855,1:35:06.623 相比Google AI的免费版本 1:35:06.690,1:35:08.592 你将拥有全套Google AI产品的使用权 1:35:08.659,1:35:11.528 并获享更高的用量限额和特殊功能 1:35:11.929,1:35:14.698 其中包括Gemini应用的Pro版本 1:35:14.798,1:35:16.967 也就是先前的Gemini Advanced 1:35:18.068,1:35:20.037 然后让我来介绍一下Google AI Ultra 1:35:20.504,1:35:23.507 它专门面向行业开拓者和先行者 1:35:23.740,1:35:27.377 以及Google前沿AI技术的尝鲜者 1:35:27.778,1:35:30.747 该方案将为用户提供最高用量限额 1:35:30.981,1:35:32.783 订阅者还可以抢先体验 1:35:32.849,1:35:35.152 Google发布的各项新产品和功能 1:35:35.586,1:35:37.754 Google AI Ultra今天仅面向美国推出 1:35:37.955,1:35:40.324 并将很快推广至全球 1:35:40.791,1:35:42.826 你可以把这个Ultra方案当成是 1:35:42.893,1:35:45.128 你专属的Google AI VIP通行证 1:35:45.929,1:35:47.598 订阅Google AI Ultra 1:35:47.831,1:35:49.566 你就能获得超高用量限额 1:35:49.666,1:35:51.468 等到2.5 Pro Deep Think模式推出后 1:35:51.535,1:35:54.638 还可以在Gemini应用中使用这种模式 1:35:55.339,1:35:59.910 你还可以抢先体验我们今天发布的Veo 3和Flow 1:36:00.510,1:36:01.712 该方案还附赠 1:36:01.778,1:36:04.548 YouTube Premium会员和海量存储空间 1:36:05.249,1:36:08.485 我们热切期待看到,借助这些全新订阅方案 1:36:08.552,1:36:11.488 你将构建、创造和挖掘出怎样的精彩 1:36:12.122,1:36:14.291 下面,让我们一同展望未来 1:36:14.625,1:36:17.894 探索我们将如何使用AI与现实世界互动 1:36:18.161,1:36:19.997 有请Shahram 1:36:34.278,1:36:35.345 大家好 1:36:35.579,1:36:39.883 此刻,Android平台正在发生许多激动人心的变化 1:36:40.584,1:36:43.787 在这个平台中,你将率先预见未来 1:36:44.621,1:36:47.190 在上周的Android Show上 1:36:47.391,1:36:49.693 我们公布了Android 16和Wear OS 6 1:36:49.926,1:36:54.097 全新的大胆设计和重大更新 1:36:55.098,1:36:59.002 当然,Android也是体验Google AI的绝佳平台 1:36:59.870,1:37:02.706 你今天看到的许多Gemini突破性创新 1:37:02.773,1:37:05.042 都会在不久之后登陆Android 1:37:05.676,1:37:09.346 你现已可以通过电源按钮立即访问Gemini 1:37:09.746,1:37:12.983 它能理解你的意图和上下文,并随时为你提供帮助 1:37:14.051,1:37:16.453 Android不止是手机系统 1:37:16.953,1:37:19.723 更是一个完整的设备生态系统 1:37:20.290,1:37:21.658 在接下来的几个月 1:37:21.992,1:37:26.463 我们将把Gemini引入你的手表、汽车仪表盘 1:37:26.897,1:37:28.265 甚至电视 1:37:28.999,1:37:30.334 无论你身在何处 1:37:30.434,1:37:34.471 都会有一位有用的AI助理伴你左右,让你的生活更轻松 1:37:35.472,1:37:38.075 那么,要不要尝试一些新兴的设备形态 1:37:38.175,1:37:42.646 让我们以全新方式体验AI助理? 1:37:43.180,1:37:46.783 这正是我们打造Android XR的原因 1:37:53.990,1:37:58.028 它是首个在Gemini时代构建的Android平台 1:37:58.261,1:38:02.733 支持不同应用场景的各种设备 1:38:03.133,1:38:07.337 从头戴设备到智能眼镜,以及其他各种智能设备 1:38:08.105,1:38:11.141 我们认为,没有哪种扩展现实设备是万能的 1:38:11.308,1:38:14.177 你在一天当中会用到不同的设备 1:38:14.811,1:38:20.083 比如,在看电影、玩游戏或处理工作时 1:38:20.250,1:38:22.519 你想要的是沉浸式头戴设备 1:38:23.220,1:38:26.957 但外出时,你会想要一副轻便的智能眼镜 1:38:27.023,1:38:30.761 让你不用掏出手机就能获得及时的信息 1:38:31.862,1:38:35.632 我们携手三星共同打造了Android XR 1:38:35.932,1:38:38.969 并与高通合作,针对骁龙处理器对其进行了优化 1:38:39.870,1:38:43.373 自从去年Android XR开发者预览版发布以来 1:38:43.774,1:38:46.643 已有数百名开发者在为该平台构建应用 1:38:47.344,1:38:49.646 我们也在为Android XR重新构建 1:38:49.713,1:38:51.815 你喜爱的各种Google应用 1:38:52.382,1:38:54.117 由于它是Android系统 1:38:54.351,1:38:57.120 所以你的手机和平板应用也与它兼容 1:38:57.954,1:39:00.023 今天,我想跟大家分享 1:39:00.090,1:39:05.729 Gemini如何颠覆头戴设备和智能眼镜用户的体验 1:39:06.563,1:39:08.064 在这些设备上 1:39:08.131,1:39:12.702 AI助理会以更丰富的方式理解你的上下文和意图 1:39:12.903,1:39:14.704 全天候为你提供支持 1:39:15.639,1:39:18.141 让我们从头戴设备中的Gemini说起 1:39:18.675,1:39:24.047 这是三星的Project Moohan,首款Android XR设备 1:39:30.887,1:39:33.457 Moohan提供无限延展的屏幕空间 1:39:33.523,1:39:36.660 让你在Gemini的陪伴下尽情探索各种应用 1:39:37.093,1:39:38.929 Android XR还集成了Google地图 1:39:39.095,1:39:41.331 只要告诉Gemini你想去哪里 1:39:41.531,1:39:44.468 它就能带你“瞬间传送”到世界任何角落 1:39:45.235,1:39:49.339 你可以和AI助理谈论你看到的一切 1:39:49.639,1:39:53.810 并让它调出你想要探索的视频和网站 1:39:54.945,1:39:59.249 我们都希望能买到自己支持球队的季票 1:39:59.749,1:40:03.854 想象一下,当你使用Moohan在MLB应用上观看球赛 1:40:03.920,1:40:05.288 你将仿佛置身现场 1:40:05.856,1:40:09.359 还可以一边观赛一边和Gemini讨论球员和比赛数据 1:40:10.527,1:40:15.465 三星的Project Moohan将于今年晚些时候发售 1:40:16.366,1:40:19.503 我们迫切期待你们能亲身体验这款设备 1:40:20.637,1:40:24.574 现在,让我们把注意力转向智能眼镜 1:40:25.342,1:40:29.613 众所周知,我们在智能眼镜领域耕耘超过十年 1:40:29.779,1:40:31.348 从未停下脚步 1:40:32.148,1:40:37.153 搭载Android XR的智能眼镜满载先进科技 1:40:37.220,1:40:40.023 但无比轻盈,适合全天佩戴 1:40:40.924,1:40:42.792 眼镜内置镜头和麦克风 1:40:43.126,1:40:46.696 让Gemini能够“看到”和“听到”这个世界 1:40:47.297,1:40:51.568 扬声器则让你可以与AI对话、播放音乐或接听电话 1:40:52.102,1:40:54.104 你也可以通过镜片内置显示屏 1:40:54.437,1:40:58.308 以私密的方式在需要时查看有用的信息 1:40:59.442,1:41:01.311 这款眼镜可以与你的手机连接 1:41:01.411,1:41:04.814 让你不用动手也能访问应用 1:41:05.849,1:41:09.786 这一切都让智能眼镜成为天然适合AI的设备形态 1:41:10.220,1:41:13.490 让Gemini的强大功能随时伴你左右 1:41:14.391,1:41:16.493 所以,与摘下眼镜才能变身的超人不同 1:41:16.726,1:41:19.930 戴上这款智能眼镜,你就能获得“超能力” 1:41:21.798,1:41:26.169 好了,谁想看Android XR眼镜的最新演示? 1:41:31.775,1:41:37.213 让我们看看它在最忙乱的环境中表现如何 1:41:37.480,1:41:39.082 比如…I/O大会的后台 1:41:39.883,1:41:43.286 我们的“超级女侠”Nishtha就在后台 1:41:43.386,1:41:45.488 她将向我们展示这款眼镜在真实环境中的使用效果 1:41:46.156,1:41:48.758 我现在就给她发个消息,然后我们马上开始 1:41:52.762,1:41:53.964 大家好! 1:41:54.431,1:41:57.033 现在,你们应该能在大屏幕上看到 1:41:57.100,1:42:00.003 我通过Android XR智能眼镜镜片看到的一切 1:42:00.236,1:42:02.205 比如这杯美味的咖啡 1:42:02.439,1:42:04.341 还有Shahram刚刚发来的这条消息 1:42:04.407,1:42:05.609 让我们看看他说了什么 1:42:07.677,1:42:09.813 很好,现在就是见证奇迹的时刻 1:42:09.879,1:42:12.315 我要启动Gemini,开始演示 1:42:13.717,1:42:15.819 给Shahram发一条消息,告诉他我已经开始了 1:42:15.885,1:42:18.021 然后把我的通知静音 1:42:20.557,1:42:22.492 好的,我已经给他发了消息 1:42:22.626,1:42:24.794 并且把你所有的通知静音了 1:42:25.128,1:42:26.262 很好 1:42:27.230,1:42:28.064 嘿,Nishtha! 1:42:28.131,1:42:28.999 嘿,Dieter! 1:42:29.065,1:42:32.769 你的灯亮着,看来我们已经开始直播了? 1:42:32.836,1:42:35.405 是的,我们已经和I/O大会的工作人员连上线了 1:42:35.572,1:42:38.441 大家好。从这个视角看I/O大会,真是太棒了! 1:42:38.508,1:42:39.743 Nishtha,你答应过我 1:42:39.809,1:42:43.146 只要我来帮忙,就送我一副Android XR眼镜 1:42:43.580,1:42:44.581 说话算数吗? 1:42:44.648,1:42:45.582 当然! 1:42:45.649,1:42:46.816 待会结束后我们去喝杯咖啡 1:42:46.883,1:42:48.084 我会把你的智能眼镜带过去! 1:42:48.151,1:42:49.052 太棒了!待会见!祝你演示顺利 1:42:49.119,1:42:50.086 谢谢 1:42:50.353,1:42:53.790 大家可以看到,我们在后台,这里真是热闹非凡 1:42:54.157,1:42:57.794 那是职业篮球运动员Giannis戴着我们的眼镜吗? 1:42:58.428,1:42:59.629 我太喜欢这眼镜了! 1:42:59.796,1:43:02.565 它解放了我的双手,让我随时能来个双手击掌 1:43:02.966,1:43:06.970 太棒了,我继续来展示这副眼镜的功能 1:43:07.437,1:43:10.273 今天一整天,我都对这面照片墙很好奇 1:43:10.707,1:43:15.178 比如这是什么乐队,他们和这个地方有什么联系? 1:43:20.784,1:43:22.585 这是Counting Crows 1:43:22.652,1:43:25.088 一支来自旧金山湾区的传奇摇滚乐队 1:43:25.155,1:43:27.390 他们在Shoreline Amphitheatre演出过很多次 1:43:27.457,1:43:29.659 这里通常被视为是他们的返乡主场 1:43:29.893,1:43:33.563 天哪!你能给我看看他们在这里演出时的照片吗? 1:43:36.433,1:43:39.469 当然,这有一张,想让我播放一首他们的歌曲吗? 1:43:39.903,1:43:42.672 好啊,我可以一边听一边走向舞台 1:43:46.443,1:43:50.080 太好了!请听Counting Crows的《Under the Aurora》 1:43:51.114,1:43:53.717 好了,大家准备好一睹这副眼镜的风采了吗? 1:43:54.117,1:43:56.352 让我们欢迎Nishtha! 1:43:57.654,1:43:58.955 Nishtha,欢迎欢迎! 1:43:59.022,1:44:00.356 大家好! 1:44:03.159,1:44:05.595 谢谢你为我们带来这段星光熠熠的幕后之旅 1:44:05.862,1:44:08.298 对了,你现在要约Dieter去喝咖啡吗? 1:44:08.364,1:44:11.868 当然…刚刚工作人员在后台给了我一杯超棒的咖啡 1:44:11.968,1:44:13.436 所以让来我试试一些好玩的功能 1:44:14.971,1:44:19.109 Gemini,刚刚那杯咖啡上的咖啡店名字是什么? 1:44:21.778,1:44:23.513 嗯…可能是Bloomsgiving 1:44:23.580,1:44:24.647 据我所知 1:44:24.714,1:44:26.783 那是卡斯特罗街上一家充满活力的咖啡馆 1:44:27.117,1:44:28.451 记性真好 1:44:34.591,1:44:36.826 你能给我看看那家咖啡馆的照片吗? 1:44:36.960,1:44:38.294 我想看看那里的氛围 1:44:41.030,1:44:41.865 没问题 1:44:41.931,1:44:43.566 这些是来自Google地图的照片,请问有帮助吗? 1:44:44.300,1:44:45.335 哦,我知道那个地方 1:44:45.401,1:44:48.605 它是一家花店,同时也卖咖啡,但它在市中心 1:44:49.339,1:44:52.375 好吧,Gemini,我走过去需要多久? 1:44:55.712,1:44:57.180 正在获取路线 1:44:58.081,1:44:59.682 步行过去大概需要1小时 1:45:00.049,1:45:01.017 好吧 1:45:01.718,1:45:03.453 也许我可以走过去,顺便刷点步数 1:45:03.520,1:45:08.057 眼镜上会直接显示完整3D地图和导航,会很轻松 1:45:17.500,1:45:22.972 帮我约Dieter今天下午3点在那家咖啡馆喝咖啡 1:45:26.676,1:45:28.044 我马上发出邀请 1:45:28.144,1:45:29.279 希望你们享受愉快的咖啡时光 1:45:30.146,1:45:33.650 如你们所见,Gemini帮助Nishtha搜索她看到的东西 1:45:33.950,1:45:37.053 记住咖啡杯这种细节 1:45:37.654,1:45:39.856 为她安排日程、甚至为她导航 1:45:40.190,1:45:43.226 而Nishtha全程都不用掏出手机 1:45:43.860,1:45:46.029 其实我现在也戴着这副眼镜 1:45:46.462,1:45:48.631 它相当于是我的个人提词器 1:45:48.898,1:45:51.334 而且它的镜片还带度数,所以我能看清你们 1:45:52.602,1:45:54.938 Nishtha,这是智能眼镜的高光时刻 1:45:55.004,1:45:55.839 我们把这一刻记录下来吧 1:45:55.905,1:45:56.739 好的 1:45:56.840,1:45:58.641 大家准备好,我们快速合个影 1:45:58.708,1:46:00.710 让我们把后台的明星也请上来! 1:46:02.579,1:46:04.047 这是Dieter 1:46:07.217,1:46:08.418 Janice来了 1:46:09.185,1:46:10.820 Gemini,帮我拍张照 1:46:19.729,1:46:23.199 Gemini,帮我拍张照,保存到我的收藏夹里 1:46:31.107,1:46:32.642 拍得真好! 1:46:40.350,1:46:42.118 我是个彻头彻尾的追星族 1:46:42.552,1:46:44.420 好的,还有最后一件事 1:46:45.088,1:46:49.158 之前,Sundar展示了实时翻译已经发展到什么程度 1:46:49.525,1:46:52.195 现在让我们看看它在智能眼镜上的表现 1:46:52.762,1:46:56.199 这个演示很有挑战,但我们试试吧! 1:46:58.201,1:47:02.005 Nishtha和我要用各自的母语交谈 1:47:02.138,1:47:03.673 Nishtha说印地语 1:47:04.007,1:47:06.709 我说波斯语,虽然我说得很烂 1:47:07.143,1:47:10.880 你们会在大屏幕上看到我俩眼镜上的实时画面 1:47:11.281,1:47:12.949 这样你们都可以明白我们在说什么 1:47:13.383,1:47:16.352 我们会实时显示英语译文 1:47:16.920,1:47:20.723 好吧,我们试试,但愿一切顺利 1:47:21.991,1:47:27.196 [波斯语] 1:47:27.263,1:47:29.565 [波斯语] 1:47:34.570,1:47:41.311 [印地语] 1:47:44.280,1:47:48.351 [波斯语] 1:47:48.851,1:47:53.823 [波斯语] 1:48:00.596,1:48:02.231 我们之前没说错,确实演示有风险 1:48:04.734,1:48:05.635 让我们… 1:48:22.418,1:48:23.353 感谢Nishtha 1:48:23.419,1:48:26.289 带我们领略了Android XR智能眼镜的魅力 1:48:31.260,1:48:33.329 有了这些Android XR设备 1:48:33.396,1:48:36.165 就好像身边有一位非常得力的助理 1:48:36.232,1:48:39.936 它将为我们带来怎样的精彩?让我们拭目以待 1:48:40.436,1:48:41.437 这还不是全部 1:48:41.871,1:48:45.575 我们正在与三星深化合作 1:48:45.875,1:48:50.380 将Android XR从头戴设备扩展到智能眼镜 1:48:51.247,1:48:54.550 我们正在创建软件和参考硬件平台 1:48:54.684,1:48:56.619 以便生态系统中的伙伴们能够与我们一起 1:48:56.686,1:48:59.055 打造出强大的智能眼镜 1:49:00.356,1:49:04.227 我们的眼镜原型目前正在由可信测试员试用 1:49:04.427,1:49:08.831 今年晚些时候,你们就可以开始为这款眼镜开发应用了 1:49:10.633,1:49:13.002 我们知道,智能眼镜必须足够时尚 1:49:13.069,1:49:15.304 你才会愿意全天佩戴 1:49:16.072,1:49:19.142 因此,今天,我们很高兴地宣布 1:49:19.675,1:49:22.812 Gentle Monster和Warby Parker 1:49:22.879,1:49:25.348 将成为我们的首批眼镜制造商合作伙伴 1:49:25.415,1:49:27.583 与我们一同打造搭载Android XR的时尚眼镜 1:49:35.591,1:49:39.162 我们希望你能戴上符合你个人品味的眼镜 1:49:40.229,1:49:41.431 这些还仅仅是开始 1:49:41.964,1:49:45.168 我热切期待你们亲自体验Android XR 1:49:45.301,1:49:47.904 在接下来的几个月,我们还会有更多精彩与大家分享 1:49:48.404,1:49:49.472 谢谢大家 1:50:04.954,1:50:07.256 这些XR眼镜实在太棒了! 1:50:07.990,1:50:11.661 就在我们眼前,研究成果转化成了现实应用 1:50:12.328,1:50:14.497 好的,我们的演讲已经接近尾声 1:50:15.164,1:50:17.333 今天你们听到了很多关于Elo评分 1:50:18.000,1:50:20.436 基准测试和先进性能的内容 1:50:21.137,1:50:23.973 但我知道大家还在等着看另外一项数据 1:50:24.440,1:50:26.075 那就是AI统计的词频数据 1:50:26.742,1:50:29.612 那么,让我们来看这最后一个排行榜 1:50:31.080,1:50:34.884 看起来,又有新选手入围了 1:50:35.485,1:50:37.120 Gemini领先 1:50:37.487,1:50:39.989 以95次的成绩胜出 1:50:41.624,1:50:43.092 非常令人振奋 1:50:46.829,1:50:50.133 言归正传,以上就是我们今天分享的所有内容 1:50:50.700,1:50:55.972 从新产品发布、产品扩展,到未来展望 1:50:56.506,1:50:59.976 AI带来了前所未有的机遇 1:51:00.810,1:51:04.881 未来的关键就在你们这些开发者和技术创新者手中 1:51:05.014,1:51:09.418 你们将推动这项技术的普及,让更多人能从中受益 1:51:10.086,1:51:13.589 最后,我想跟大家分享几个给我带来激励的真实案例 1:51:13.689,1:51:17.026 首先是加州居民以及世界各地的人们 1:51:17.426,1:51:19.362 最关心的问题——野火 1:51:20.096,1:51:23.266 想必有许多人都认识野火的受灾者 1:51:23.799,1:51:27.570 野火的发生往往很突然,并在几分钟内失控蔓延 1:51:28.304,1:51:31.107 因此,野火检测的速度和精度至关重要 1:51:31.741,1:51:34.076 我们正在与一群了不起的合作伙伴一起 1:51:34.544,1:51:36.779 构建一个名为FireSat的项目 1:51:36.879,1:51:42.285 它是一个卫星星座,利用多光谱卫星图像和AI 1:51:42.652,1:51:45.655 旨在提供近乎实时的野火观测数据 1:51:46.088,1:51:47.623 看看这个分辨率 1:51:48.024,1:51:51.694 它可以探测到面积小至25平方米的火灾 1:51:52.361,1:51:54.530 大约相当于一个单车位车库的大小 1:51:55.231,1:51:57.266 我们的第一颗卫星现已入轨 1:51:57.633,1:51:59.202 项目全面投入运行后 1:51:59.602,1:52:02.672 图像更新频率将大幅提高 1:52:03.105,1:52:05.007 从目前的每12小时更新一次 1:52:05.074,1:52:06.943 缩短到每20分钟更新一次 1:52:15.685,1:52:18.654 在其他类型的应急响应中,速度同样至关重要 1:52:19.288,1:52:20.823 例如,在海伦飓风期间 1:52:21.057,1:52:23.960 Wing与沃尔玛、红十字会合作 1:52:24.427,1:52:27.230 用无人机投送物资,为救援工作提供了支持 1:52:27.763,1:52:29.031 在AI的帮助下 1:52:29.165,1:52:32.201 我们能够根据实时需求将食物、药品等关键物资 1:52:32.668,1:52:36.606 投放到北卡罗来纳州的一个基督教青年会避难所 1:52:37.206,1:52:41.244 可以想象这在其他社区的救灾行动中会有多大帮助 1:52:41.911,1:52:44.113 我们也正在积极努力扩大这一技术的应用范围 1:52:44.880,1:52:48.484 这些都是AI目前造福社会的例子 1:52:49.252,1:52:50.920 尤其令人鼓舞的是 1:52:50.987,1:52:55.424 今天的研究成果将在短短几年内成为现实 1:52:56.192,1:52:59.629 无论是构建下一代实用机器人 1:53:00.496,1:53:03.299 为世界致死率最高的疾病寻找治疗方法 1:53:04.100,1:53:06.802 还是推进纠错量子计算机的发展 1:53:07.436,1:53:12.608 或是打造能将乘客安全送达[br]任何地点的全自动驾驶汽车 1:53:13.409,1:53:17.446 所有这些都极有可能在几年内实现,而不是几十年 1:53:17.780,1:53:18.681 真是令人向往 1:53:19.382,1:53:23.152 这种利用AI改善生活的机会并不是我在想当然 1:53:23.919,1:53:26.322 最近的一次经历让我深有体会 1:53:26.756,1:53:29.191 当时我和父母一起到旧金山旅游 1:53:29.625,1:53:31.127 与许多其他游客一样 1:53:31.193,1:53:33.696 他们想做的第一件事就是体验Waymo的自动驾驶 1:53:34.797,1:53:36.299 我以前也坐过Waymo 1:53:36.365,1:53:41.504 但看着我八十多岁的父亲坐在前排那种惊讶的表情 1:53:41.737,1:53:44.640 我从全新的视角看到了科技进步的影响 1:53:45.241,1:53:48.844 它让我看到,科技拥有多么不可思议的力量 1:53:48.911,1:53:52.281 它能激发灵感、造福所有人、并推动我们前进 1:53:52.682,1:53:54.050 我迫不及待想看看 1:53:54.116,1:53:56.485 接下来我们会共同创造出怎样的精彩成果 1:53:56.619,1:53:57.453 谢谢大家 1:54:09.932,1:54:12.802 Flow为我开启了无限可能 1:54:12.968,1:54:14.870 那是什么样的魔法? 1:54:15.404,1:54:18.841 AI模式是自搜索引擎发明以来最伟大的革命 1:54:19.075,1:54:21.744 只需准确地告诉Gemini你想要构建什么 1:54:21.811,1:54:23.245 它就会为你搞定 1:54:23.312,1:54:24.146 天哪 1:54:24.213,1:54:26.449 你可以用Gemini 2.5 Pro编程 1:54:26.849,1:54:28.584 实在太好用了 1:54:28.651,1:54:30.953 Project Mariner将改变我们使用浏览器的方式 1:54:31.020,1:54:34.090 它是一个能帮你处理事务的AI智能体 1:54:34.156,1:54:37.259 Notebook LMS思维导图颠覆了我们学习的方式 1:54:37.326,1:54:40.129 为什么无论我走到哪,这个人都在跟踪我? 1:54:40.363,1:54:41.697 那是你的影子 1:54:42.031,1:54:42.898 等等,你要右转 1:54:45.267,1:54:47.870 AI正在彻底改变我们对抗野火的方式 1:54:48.137,1:54:51.340 生成式媒体正在拓展创造力的边界 1:54:51.707,1:54:53.275 我第一次看到这个的时候,感觉就像魔法一样 1:54:53.476,1:54:54.510 它不仅仅是又一项工具 1:54:54.577,1:54:55.544 它颠覆了一切 1:54:55.611,1:54:57.313 简直让我大开眼界 1:54:57.380,1:54:59.348 AI的潜力近乎无限