谷歌 Gemini Omni 全能模型发布：可从任意输入生成任意输出，一句话让 AI 修改视频

1 天前 / 阅读约2分钟

来源：IT之家

谷歌在2026 I/O开发者大会上发布Gemini Omni模型，为Gemini模型家族最全面版本，能处理多模态信息，支持对话式编辑，并推出首款模型Gemini Omni Flash。

感谢IT之家网友软媒用户1053564、HH_KK 的线索投递！

IT之家 5 月 20 日消息，在今日的 2026 谷歌 I/O 开发者大会上，谷歌正式发布了 Gemini Omni 模型。

诺贝尔奖获得者、Google DeepMind 负责人哈萨比斯（Demis Hassabis）表示，Gemini Omni 是 Gemini 模型家族迄今为止能力最为全面的版本。“Omni”意指“全能”，该模型在处理文字、图像、视频、音频等多种模态信息时，展示出前所未有的流畅性与深度。

Gemini Omni 宣称能“从任何输入生成任何输出”，支持对话式编辑，用户可一句话改变视频中的角色、背景等元素。

IT之家从大会获悉，谷歌还宣布推出 Gemini Omni 家族首款模型 Gemini Omni Flash，即日起可在 Gemini App、Google Flow、YouTube Shorts 可用，未来将推 API 服务。

2026 谷歌 I/O 开发者大会专题

2 天前

马斯克最新访谈：谈脑机、无人驾驶、机器人、太空

2 天前

中国电信研究院完成全球首次50G-PON互通性系统验证

2 天前

马斯克：十年后90%的出行都是自动驾驶人类开车将成小众行为

2 天前

2 天前

LightCounting：光通信供应链全线飘红，这样的增长还能持续吗？

2 天前

2 天前

中信科移动：全栈赋能，打通天地数字生命线

2 天前

持续赋能千行百业中国卫星导航产业产值超6000亿元

2 天前

小鹏GX首台Robotaxi量产车下线

2 天前

三星电子与工会展开最后谈判，以避免威胁全球供应链的罢工