Grok Imagine Video 1.5 模型正式上线:生成 6 秒 720P 视频仅需 25 秒
18 小时前 / 阅读约2分钟
来源:IT之家
xAI公司正式上线Grok Imagine Video 1.5模型,主打静态图一键生成带同步音频的短视频,升级音画同步、运动真实性和生成速度,已结束预览在xAI API中提供。

IT之家 6 月 17 日消息,马斯克旗下 xAI 公司今天(6 月 17 日)发布公告,宣布正式上线 Grok Imagine Video 1.5 模型,并在 xAI API 中结束预览正式上线。

xAI 于 2026 年 6 月 3 日推出 Grok Imagine Video 1.5 Preview 预览版,主打“静态图一键生成带同步音频的短视频”,相比前代,主要升级音画同步、运动真实性和生成速度。

在音画同步方面,该模型在单次生成中同时输出音效、环境音和对话,精准对齐音频与画面动作。该模型大幅提升语音清晰度,口型同步效果更自然,适用于需要人物配音的短片创作。IT之家附上相关上视频如下:

在运动与物理表现方面,Grok Imagine Video 1.5 增强视频内的运动连贯性,明显减少常见的人物肢体扭曲、物体飘浮假象。模型能更好地模拟重量感与动量,例如人物走路时衣摆的自然晃动、下落物体的加速轨迹,整体观感更接近真实物理世界。

在生成速度方面,Grok Imagine Video 1.5 Fast 模式下,生成一段 6 秒、分辨率 720p 的视频仅需约 25 秒,而前代需要 40 秒以上。

Grok Imagine Video 1.5 已结束预览,在 xAI API 中以 grok-imagine-video-1.5 模型名称提供。开发者可通过上传起始图片、描述运动方式,并选择分辨率和时长来调用。