Google I/O大会精华回顾：Chrome AI模式、Gemini Live、XR眼镜等亮点 - AI

Google演讲者在I/O大会上主要聚焦AI与Gemini，将XR眼镜作为压轴展示。James Martin/CNET

今年的Google I/O开发者大会被AI元素深深烙印。Google不仅展示了Gemini AI平台的最新进展，还首次推出了高端AI Ultra订阅计划（价格惊人：每月250美元）。

此外，Google还推出了全新的Flow应用，扩展了视频生成工具集，并在大会尾声揭晓了新款Android XR眼镜。

公司自豪地宣布，AI的使用率和性能均有所提升（随着Google Cloud将在今年晚些时候推出新的42.5 exaflop Ironwood Tensor处理单元，这一趋势还将持续）。

欲了解更多活动详情，请查阅我们对Google I/O的实时博客报道。

Google新视频生成工具Flow正在运行。Google/Screenshot by Joe Maldonado/CNET

5月13日，Google为Android举办了一场独立活动，推出了Android 16，首次展示了Material 3 Expressive界面，更新了安全功能，并介绍了Gemini的集成与功能升级。

众多令人瞩目的AI新功能需通过特定订阅级别方可获得。AI Pro实为Google每月20美元Gemini Advanced计划的更名版（新增部分功能），而Google AI Ultra则是一个更为昂贵的全新选项——每月250美元（目前前三个月半价），提供对所有最新、最酷、限制最少的工具和模型的访问权限，以及用于管理AI代理的原型和30TB存储空间。这些服务今日已全面上线。

Google还致力于通过个性化智能回复让自动化回复更加智能，使生成的答案更贴近您的风格，同时浏览设备上的信息片段以提供相关信息。该功能将于今年夏天率先面向订阅用户推出Gmail服务，最终将全面普及。

Gemini在《口袋妖怪蓝》中的胜利成为Google的一大吹嘘点。然而，特约撰稿人Zach McAuliffe对此表示怀疑，因为他不愿童年的美好回忆被玷污。

Project Aura的XR眼镜。James Martin/CNET

此外，大会还详细介绍了诸多更好的模型、更高效的编码工具及其他开发者友好型功能，这些都是开发者大会的常规亮点。公告中提及的对话式Gemini Live，作为昔日Project Astra的一部分，是一款交互式、代理式、语音AI的万能应用。（如主编Patrick Holland所言，“Astra是对功能的预演，当它们准备就绪时，将被整合至Gemini Live中。”）对于研究人员而言，NotebookLM集成了Gemini Live以优化其各项功能。

该功能现已在美国上线。

Chrome AI模式

年满18岁且愿意付费订阅的用户，以及使用Chrome Beta、Dev和Canary版本的用户，将可体验公司在Chrome中扩展的Gemini集成功能——基于屏幕内容的摘要、研究及代理式聊天，与Gemini Live在手机上的功能颇为相似（自今日起，Android和iOS用户均可免费体验）。但Chrome版本更贴合用户在计算机上的操作习惯，而非手机。（Microsoft已在自家的Edge浏览器中通过Copilot实现了类似功能。）

长远来看，Google计划让Chrome中的Gemini能够整合多个标签页并实现语音导航。

作为AI模式的一部分，公司还在优化用户与Google搜索中AI概览的交互方式，包括与AI概览的互动及更智能的购物辅助。它是一个带有搜索功能的新标签页，或在搜索栏中直接使用，现已上线。它融合了深度搜索与个人上下文（利用关于您的所有信息，数量庞大）来提出建议和定制回复。

Google/Screenshot by Joe Maldonado/CNET

公司详细介绍了其全新的购物AI模式，该模式提供了更加流畅的对话式购物体验、监控最佳价格的结账流程，以及更新的“试穿”界面，允许用户上传个人照片进行试穿，而非使用通用模型。

我们对这一功能持保留意见——首先，它听起来像是一场隐私噩梦；其次，我真的不想看到衣服穿在“真实”的自己身上。

Google计划尽快推出该功能，但更新的“试穿”界面现已通过Search Labs在美国上线。

Google Beam

前身为Project Starline，Google Beam是公司3D视频会议技术的升级版，现已融入AI技术。它采用六摄像头阵列捕捉您的全方位视角，随后通过AI拼接图像，利用头部追踪技术追踪您的动作，并以每秒高达60帧的速度传输。

该平台采用光场显示技术，无需佩戴任何特殊设备，但该技术对偏离角度的观看较为敏感。HP在大规模扫描业务（包括3D扫描）方面经验丰富，因此与Google的合作并不意外。

Imagen 4在字体处理上更上一层楼。Google/Screenshot by Joe Maldonado/CNET

Flow及其他生成式创意工具

Google Flow是一款新工具，基于Imagen 4和Veo 3构建，可完成创建AI视频片段、将它们拼接成更长的序列或扩展视频长度等任务，同时保持场景间的一致性。它还提供了摄像头控制等编辑工具，是Gemini AI Ultra的一部分。

Imagen 4在图像生成方面更加精细，色调与文本排版均有改进，且速度更快。同时发布的Veo 3对物理学和原生音频生成（音效、背景声音和对话）有了更深刻的理解。

上述所有功能均包含在AI Pro计划中。Google的Synth ID生成式AI检测工具今日也已正式上线。