8月26日,面壁智能开源了8B参数的MiniCPM-V 4.5多模态模型,该模型具备出色的‘高刷’视频理解能力。据称,其视频理解性能同级领先,超越了Qwen2.5-VL 72B。在相同视觉token开销下,MiniCPM-V 4.5能处理6倍于常规的视频帧数,实现96倍视觉压缩率,效率为同类模型的12-24倍。