2025年12月4日,北京智源人工智能研究院发布新一代多模态大模型Emu3.5,该模型实现图像、文本、视频的“世界级统一建模”,通过“下一状态预测”技术,具备原生多模态能力和世界建模能力,推理速度提升20倍,性能比肩顶级模型。