微软发布开源数学推理模型 rStar2-Agent - AI

Just Quick Just Quality

热门话题

白天

搜索

资讯

微软发布开源数学推理模型 rStar2-Agent

2025-09-02

微软近日发布了开源数学推理模型rStar2-Agent，该模型参数规模仅为140亿，却通过智能思考的方式，实现了与6710亿参数模型相当的性能。rStar2-Agent能够自主规划推理步骤、调用代码工具，并根据工具反馈验证思路，这一能力得益于其采用的GRPO-RoC算法、高效强化学习基础设施以及多阶段训练方案。这些创新使得rStar2-Agent在有限资源下仍能实现高效训练，并在多个任务中展现出强大的泛化能力。这一突破性进展为大模型的发展提供了新的思路，预示着未来模型可能更加注重智能思考和工具使用的能力。

上一篇：ChatGPT韩国用户数量首次突破2000万

下一篇：DeepSeek等大模型集体“打标” 从此告别AI造假？

返回列表

热文阅读

2 天前

欧洲遭史上最热高温，美的“卡bug”空调被抢爆了，二手溢价一度达原价2-3倍

2 天前

比亚迪亮相 2026 釜山车展，首次在韩展示 DM-i 混动技术

2 天前

英伟达年度“最危险”论文！AI自繁衍代码，无限刷级进化

2 天前

内存大涨价，玩家用 DDR1 平台成功运行 Win11 系统