刚刚,OpenAI研究员Sheryl Hsu官宣:其内部研发的AI推理系统,在全球顶级编程竞赛——2025年国际信息学奥林匹克竞赛(IOI)中,取得了金牌
这是AI首次在该领域达到金牌水平,并且在所有AI参赛者中排名第一
在与全球330名顶尖人类选手的同场竞技中,这套AI系统的成绩超越了其中98%的选手,仅有5位人类天才的得分比它更高
纯靠推理:无网络、无RAG,与人类公平对决
Sheryl Hsu在推文中特别强调,OpenAI的AI系统是在完全模拟人类选手的环境下进行比赛的:
完全断网: 无法访问互联网,杜绝了一切开卷考试的可能性
无RAG(检索增强生成): 无法调用外部知识库,所有解题逻辑必须由模型内生生成
同等限制: 和人类选手一样,只有5小时的比赛时间和50次代码提交机会
基础工具: 只能使用一个基础的终端工具
这样保证了AI不靠海量信息检索作弊,而是像一个真正的人类选手一样,在封闭、高压的环境下,纯粹依靠自身的逻辑推理和问题解决能力来编写代码、解决复杂算法问题
通用模型,而非特长生
OpenAI透露,他们使用的是一个通用推理模型的集成系统(ensemble),并没有针对IOI竞赛进行任何专门的训练或微调
团队唯一的人工干预仅仅在于:
1. 从模型生成的多个解法中,选择最优的那个进行提交
2. 将模型与IOI的提交API进行连接
除此以外,所有的解题过程全部由AI自主完成
一年从差点青铜到稳拿金牌
Sheryl Hsu提到,去年的IOI竞赛,OpenAI也曾尝试过,但结果并不理想,最终与一枚铜牌擦肩而过,仅排在49%分位。并且,去年的方案还动用了大量手工定制的测试时策略
而仅仅一年之后,OpenAI就实现了从49%分位到98%分位的大逆转,从差点青铜一跃成为金牌王者
GPT-5塌房,下一代模型什么时候发布?
最近几周,OpenAI这个神秘的内部推理系统模型可谓是捷报频传,在多个世界顶级智力竞赛中展现了强大实力:
AtCoder世界总决赛: 取得第二名
IMO2025(国际数学奥林匹克):宣称取得金牌
IOI2025(国际信息学奥林匹克): 斩获金牌
那么这个内部推理系统是什么?下半年OpenAI还有真正的大招?