今年的Google I/O开发者大会被AI元素深深烙印。Google不仅展示了Gemini AI平台的最新进展,还首次推出了高端AI Ultra订阅计划(价格惊人:每月250美元)。
此外,Google还推出了全新的Flow应用,扩展了视频生成工具集,并在大会尾声揭晓了新款Android XR眼镜。
公司自豪地宣布,AI的使用率和性能均有所提升(随着Google Cloud将在今年晚些时候推出新的42.5 exaflop Ironwood Tensor处理单元,这一趋势还将持续)。
欲了解更多活动详情,请查阅我们对Google I/O的实时博客报道。
Google新视频生成工具Flow正在运行。Google/Screenshot by Joe Maldonado/CNET
5月13日,Google为Android举办了一场独立活动,推出了Android 16,首次展示了Material 3 Expressive界面,更新了安全功能,并介绍了Gemini的集成与功能升级。
众多令人瞩目的AI新功能需通过特定订阅级别方可获得。AI Pro实为Google每月20美元Gemini Advanced计划的更名版(新增部分功能),而Google AI Ultra则是一个更为昂贵的全新选项——每月250美元(目前前三个月半价),提供对所有最新、最酷、限制最少的工具和模型的访问权限,以及用于管理AI代理的原型和30TB存储空间。这些服务今日已全面上线。
Google还致力于通过个性化智能回复让自动化回复更加智能,使生成的答案更贴近您的风格,同时浏览设备上的信息片段以提供相关信息。该功能将于今年夏天率先面向订阅用户推出Gmail服务,最终将全面普及。
Gemini在《口袋妖怪蓝》中的胜利成为Google的一大吹嘘点。然而,特约撰稿人Zach McAuliffe对此表示怀疑,因为他不愿童年的美好回忆被玷污。
Project Aura的XR眼镜。James Martin/CNET
此外,大会还详细介绍了诸多更好的模型、更高效的编码工具及其他开发者友好型功能,这些都是开发者大会的常规亮点。公告中提及的对话式Gemini Live,作为昔日Project Astra的一部分,是一款交互式、代理式、语音AI的万能应用。(如主编Patrick Holland所言,“Astra是对功能的预演,当它们准备就绪时,将被整合至Gemini Live中。”)对于研究人员而言,NotebookLM集成了Gemini Live以优化其各项功能。
该功能现已在美国上线。
Chrome AI模式
年满18岁且愿意付费订阅的用户,以及使用Chrome Beta、Dev和Canary版本的用户,将可体验公司在Chrome中扩展的Gemini集成功能——基于屏幕内容的摘要、研究及代理式聊天,与Gemini Live在手机上的功能颇为相似(自今日起,Android和iOS用户均可免费体验)。但Chrome版本更贴合用户在计算机上的操作习惯,而非手机。(Microsoft已在自家的Edge浏览器中通过Copilot实现了类似功能。)
长远来看,Google计划让Chrome中的Gemini能够整合多个标签页并实现语音导航。
作为AI模式的一部分,公司还在优化用户与Google搜索中AI概览的交互方式,包括与AI概览的互动及更智能的购物辅助。它是一个带有搜索功能的新标签页,或在搜索栏中直接使用,现已上线。它融合了深度搜索与个人上下文(利用关于您的所有信息,数量庞大)来提出建议和定制回复。
Google/Screenshot by Joe Maldonado/CNET
公司详细介绍了其全新的购物AI模式,该模式提供了更加流畅的对话式购物体验、监控最佳价格的结账流程,以及更新的“试穿”界面,允许用户上传个人照片进行试穿,而非使用通用模型。
我们对这一功能持保留意见——首先,它听起来像是一场隐私噩梦;其次,我真的不想看到衣服穿在“真实”的自己身上。
Google计划尽快推出该功能,但更新的“试穿”界面现已通过Search Labs在美国上线。
Google Beam
前身为Project Starline,Google Beam是公司3D视频会议技术的升级版,现已融入AI技术。它采用六摄像头阵列捕捉您的全方位视角,随后通过AI拼接图像,利用头部追踪技术追踪您的动作,并以每秒高达60帧的速度传输。
该平台采用光场显示技术,无需佩戴任何特殊设备,但该技术对偏离角度的观看较为敏感。HP在大规模扫描业务(包括3D扫描)方面经验丰富,因此与Google的合作并不意外。
Imagen 4在字体处理上更上一层楼。Google/Screenshot by Joe Maldonado/CNET
Flow及其他生成式创意工具
Google Flow是一款新工具,基于Imagen 4和Veo 3构建,可完成创建AI视频片段、将它们拼接成更长的序列或扩展视频长度等任务,同时保持场景间的一致性。它还提供了摄像头控制等编辑工具,是Gemini AI Ultra的一部分。
Imagen 4在图像生成方面更加精细,色调与文本排版均有改进,且速度更快。同时发布的Veo 3对物理学和原生音频生成(音效、背景声音和对话)有了更深刻的理解。
上述所有功能均包含在AI Pro计划中。Google的Synth ID生成式AI检测工具今日也已正式上线。