凤凰网科技讯 12月17日,小米官方宣布Xiaomi MiMo-V2-Flash开源。据悉,该模型是小米专为极致推理效率自研的总参数309B(激活15B)的MoE模型,通过引入Hybrid 注意力架构创新及多层MTP推理加速,在多个Agent测评基准上进入全球开源模型Top2。代码能力比肩标杆闭源模型Claude 4.5 Sonnet,但推理价格仅为其2.5%且生成速度提升至2倍。

今日上午的2025小米“人车家全生态”合作伙伴大会上,Xiaomi MiMo大模型负责人罗福莉也介绍了该模型构建的细节。她称,Xiaomi MiMo-V2-Flash在大部分评测基准上超过了DeepSeek V3.2和K2-Thinking,同时对比参数量减少了二分之一至三分之二,在全球大致处于相同水位的顶尖模型速度和成本象限里,MiMo-V2-Flash实现了低成本、高速度,已初步具备模拟世界的能力。

罗福莉称,在她看来,下一代智能体系统不是一个“语言模拟器”,而是一个真正理解人类世界,并与之共存的“智能体”。Agent执行能力方面,应实现从“回答问题”到“完成任务”的转变,具备记忆、推理、自主规划、决策、执行等能力。从Omni感知角度看,应实现统一多模态感知,为理解物理世界打基础,从而更好地嵌入眼镜等智能终端。
