金句媲美雷军,罗福莉首次站台小米演讲,揭秘MiMo大模型和背后团队
10 小时前 / 阅读约8分钟
来源:36kr
小米举办年度“人车家全生态”合作伙伴大会,罗福莉首次解读小米大模型三个重点方向,发布MiMo-V2-Flash模型并开源。小米未来五年研发投入预计超2000亿,全力冲刺AI。

罗福莉加入小米后的首次公开演讲,来了!

智东西12月17日北京现场报道,刚刚,小米举办了年度“人车家全生态”合作伙伴大会,现场人头攒动座无虚席,展区不少展台都已被围观人群挤满,讨论热度颇高。

小米创始人兼CEO雷军此次并未来到现场,小米集团合伙人、集团总裁卢伟冰率先登台演讲,今天第三位演讲的是当前备受关注的原DeepSeek核心成员、被业内称为“天才少女”的罗福莉,她现在的职位是小米MiMo大模型负责人。

罗福莉在演讲过程中虽然稍显紧张,但她抛出的海量金句却句句令人印象深刻:

·AI正以非线性的方式重演人类大脑6亿年的进化史;

·语言是人类思维和物理世界在符号空间的“投影”;

·下一代智能体系统不是一个“语言模拟器”,而是一个真正理解我们世界、并与之共存的“智能体”;

·相比生物演化的稳固根基,AI的发展是“空中楼阁”;

·AI进化的下个起点,一定是有一个能跟物理世界交互的模型;

·算力和数据也并非最终的护城河,真正的护城河,是科学的研究文化与方法,是将未知问题结合模型优化转化为可用产品的能力;

·开源的价值本质上是一种分布式的技术加速主义;

·开源是实现AGI的普惠化,是确保所有人类的智慧共同进化的唯一路径;

在演讲中,罗福莉首次明确解读了小米打造Agent语言基座模型的三个核心方向,解读了新模型背后的多项关键技术突破。对小米如何通向AGI,罗福莉也明确了小米的路径。

除了AI大礼包,今天会上,卢伟冰也分享了小米整体业务的诸多亮点。

卢伟冰说,2025年是小米“大发展”的一年,今年前三季度,小米收入同比增长32.5%,超过了3400亿元,经调整利润同比增长73.5%,其中手机销量中国市场1-10月排名第二。

未来五年,小米集团研发投入预计将超过2000亿元,2026年预计研发投入在400亿左右。

小米人车家生态究竟包括什么?卢伟冰这次给出详细拆解:

产品包括个人设备、出行设备、家庭设备;

核心技术包括芯片、OS、AI;

智能制造包括手机、汽车、大家电工厂;

什么是小米当前聚焦的核心,一目了然。

在大家最关心的AI方面,小米自研MiMo系列大模型家族赫然呈现:推理大模型、视觉推理大模型、原生端到端音频生成模型、端侧视觉语言大模型、具身大模型。

一个月前的11月12日,罗福莉在朋友圈正式官宣加入小米Xiaomi MiMo团队。就在昨晚,小米刚刚发布了最新的MiMo大模型MiMo-V2-Flash,性能媲美DeepSeek-V3.2,这也是罗福莉加入后MiMo团队亮出的首个新成果。

01.罗福莉首次解读:小米大模型三个重点方向,算力和数据并非最终护城河

罗福莉一上台就回到了“6亿年前”,她说,AI正以非线性的方式重演人类大脑6亿年的进化史。

为什么大模型“智能”起源于语言?在罗福莉看来,语言是人类思维和物理世界在符号空间的“投影”,而大模型成功解码了人类思维在文本空间的投影。

小米从“语言”出发,构建了面向Agent时代的语言基座模型MiMo-V2-Flash。

在小米看来,超强的代码和工具调用能力是Agent沟通的高效“语言”,围绕极致推理效率设计的模型结构是“高带宽”的Agent协作的关键,全新后训练范式则能够保证高效稳定的扩展强化学习训练。

这三个方面是小米聚焦的重点。

罗福莉特别提到,MiMo-V2-Flash模型并不大,但在代码和Agent测评基准测试中已经达到全球开源模型TOP2。

MiMo-V2-Flash的推理效率是其突出优势,在全球大致相同水位的顶尖模型速度和成本象限里,MiMo-V2-Flash实现了低成本和高速度优势。

具体来看,小米围绕极致推理效率来设计模型结构,采用了Hybrid SWA架构,固定KV Cache,增强长文推理,此外,团队采用3层MTP推理加速并行Token验证,实现推理速度2-2.6倍的提升。

在全新后训练范式方面,团队采用了Dense&Token-Level的强化学习。

当前MiMo-V2-Flash已经初步具备了模拟世界的能力,比如通过HTML写操作系统、模拟太阳系、画一颗圣诞树。

今天发布会现场,罗福莉宣布MiMo-V2-Flash发布即开源,模型权重、技术报告都开源,API限时免费。

对于未来的Agent发展,罗福莉提到,下一代智能体系统,不是一个“语言模拟器”,而是一个真正理解我们世界、并与之共存的“智能体”。

Agent执行从“回答问题”到“完成任务”,具有记忆、推理、自主规划、决策、执行的能力。

Omni感知统一多模态感知,为AI理解物理世界打下基础,嵌入眼镜等智能终端、融入日常工作流。

在通往AGI的路上,罗福莉团队希望补全缺失的演化拼图,单纯Scaling UP参数量不够,他们要让LLM回到“演化课堂”,补上它跳过的关键学习步骤。

简单来说,他们非常看重AI与真实世界的交互,强调多模态。

罗福莉特别提到,相比生物演化的稳固根基,AI的发展有些像“空中楼阁”。在她看来,AI进化的下个起点,一定是有一个能跟物理世界交互的模型。

AI不仅要看懂画面,还要理解背后的物理规律;AI不仅要推理文本,而是理解世界的运作逻辑。

罗福莉说,这一观点并非共识,行业中也有不少人认为语言就可以实现最终的AGI,比如Ilya。

在她看来,算力和数据也并非最终的护城河,真正的护城河,是科学的研究文化与方法,是将未知问题结合模型优化转化为可用产品的能力。

罗福莉现场也开启了“招聘会”,她提到,小米大模型Core团队是研究、产品与工程深度耦合的年轻团队,“小而美”却充满创业精神,他们极度好奇、追求真理。

罗福莉提到,在她刚刚开始研究时,开源模型与顶尖模型的代差有三年,而今天这一差距已经缩短到了“数月”。

他们相信开源的价值,开源的价值本质上是一种分布式的技术的加速的主义。在罗福莉看来,开源是实现AGI的普惠化,是确保所有人类的智慧共同进化的唯一路径。

未来,从数据的极致压缩,到算法的范式创新,再到与物理空间的深度链接,小米与全球AI共同定义未来。

95后罗福莉本科就读于北京师范大学计算机专业,硕士毕业于北京大学计算语言学研究所计算语言学专业。她曾在阿里巴巴达摩院主导开发了多语言预训练模型VECO,并推动了AliceMind的开源工作,2022年入职DeepSeek,参与了MoE大模型DeepSeek-V2的研发。

集诸多光环于一身,来到小米的罗福莉,其动向一直是业内关注的焦点。

02.结语:猛攻Agent基座模型,小米人车家生态全力冲刺AI

AI,显然是整场小米生态大会围绕的核心关键词。

面向AI未来,小米的机会点显然不止于AI手机,手机、PC、穿戴、IoT、汽车,小米人车家全生态均能与AI深度融合,小米在大模型方面的AI基础能力提升则进一步加速了这一进程。

卢伟冰近日曾提到,小米AI大模型业务过去投入持续增长,“AI与现实世界深度融合”已被列为小米未来十年核心战略。显然,面对AI这场硬仗,小米已经做好准备All in,“兵马和粮草”都在加码筹备。