视频AI卷向5分钟：全量开源，一次生成，正式告别“盲盒抽卡”

4 小时前 / 阅读约1分钟

来源：凤凰网

过去一年视频生成赛道动作频频，谷歌、字节、快手、阿里等公司推出新模型，但AI长视频仍面临角色一致性、声音变化等问题，难以进入专业内容生产工作流，新技术带来新图景。

编辑｜泽南、杨文

AI 视频生成，卡在长视频这道坎上太久了。

过去一年，视频生成赛道动作频频。谷歌推出 Veo 系列，并在今年 I/O 大会发布新一代多模态视频生成与编辑模型 Gemini Omni Flash；字节的 Seedance2.0、快手可灵、阿里的欢乐马也一次又一次，打破了我们的预期。

各家模型生成的画面一个比一个好看，只可惜时长大多不超过 20 秒。一旦把视频拉长到分钟级，麻烦就来了，要么是同一角色跨镜头后面目全非，要么是说着说着声音变了或没了；想改一个镜头，整条视频还得重新生成……

正因如此，AI 长视频难以真正进入专业内容生产的工作流。

最近，一项开源的新技术却向我们展示了一幅完全不同的图景。

先来看个 case。

2 天前

豆包将推付费版，第三方称上月月活首次下滑

2 天前

浙江台州问界 M9 事故现场镜头画面曝光，大块金属部件曾顶起车身

2 天前

法拉利首款纯电车型 Luce 遭群嘲，马自达、日产也来玩梗调侃

2 天前

1 天前

Anthropic：高昂的计算成本是推动IPO的主因，呼吁全球暂缓前沿AI研发

2 天前

腾讯最强的牌，也是AI最大的锁

1 天前

连GitLab都开始裁程序员了

1 天前

突发！Anthropic呼吁全员停止AI研究

1 天前

他，雇AI卖房，多赚61万

2 天前

长安、小米、极氪密集调整，车企集体「不装了」