当地时间2025年9月9日,阿联酋穆罕默德·本·扎耶德人工智能大学(MBZUAI)与G42联合发布低成本AI推理模型“K2 Think”。该模型基于阿里巴巴开源的Qwen 2.5架构构建,仅需320亿参数即可实现超越规模大20倍的同类模型的性能,并在Cerebras硬件上完成运行测试。MBZUAI基础模型研究所所长Hector Liu透露,团队通过长链式思维监督微调(CoT)和推理阶段扩展(test-time scaling)等技术组合实现性能突破。该模型专为数学、科学等特定领域设计,旨在缩短复杂问题研究周期,降低AI技术使用门槛。
