人工智能

OpenAI内部神秘模型首次斩获信息学奥赛IOI 2025金牌 碾压98%人类选手

字号+作者:AI寒武纪 来源:AI寒武纪 2025-08-12 07:28 评论(创建话题) 收藏成功收藏本文

刚刚,OpenAI研究员SherylHsu官宣:其内部研发的AI推理系统,在全球顶级编程竞赛——2025年国际信息学奥林匹克竞赛(IOI)中,取得了金牌,这是AI首次在该领域达到金'...

刚刚,OpenAI研究员SherylHsu官宣:其内部研发的AI推理系统,在全球顶级编程竞赛——2025年国际信息学奥林匹克竞赛(IOI)中,取得了金牌,这是AI首次在该领域达到金牌水平,并且在所有AI参赛者中排名第一。vCJ品论天涯网


vCJ品论天涯网


vCJ品论天涯网

在与全球330名顶尖人类选手的同场竞技中,这套AI系统的成绩超越了其中98%的选手,仅有5位人类天才的得分比它更高vCJ品论天涯网


vCJ品论天涯网

纯靠推理:无网络、无RAG,与人类公平对决vCJ品论天涯网

SherylHsu在推文中特别强调,OpenAI的AI系统是在完全模拟人类选手的环境下进行比赛的:vCJ品论天涯网

完全断网:无法访问互联网,杜绝了一切开卷考试的可能性vCJ品论天涯网

无RAG(检索增强生成):无法调用外部知识库,所有解题逻辑必须由模型内生生成vCJ品论天涯网

同等限制:和人类选手一样,只有5小时的比赛时间和50次代码提交机会vCJ品论天涯网

基础工具:只能使用一个基础的终端工具vCJ品论天涯网

这样保证了AI不靠海量信息检索作弊,而是像一个真正的人类选手一样,在封闭、高压的环境下,纯粹依靠自身的逻辑推理和问题解决能力来编写代码、解决复杂算法问题vCJ品论天涯网

通用模型,而非特长生vCJ品论天涯网

OpenAI透露,他们使用的是一个通用推理模型的集成系统(ensemble),并没有针对IOI竞赛进行任何专门的训练或微调vCJ品论天涯网


vCJ品论天涯网

团队唯一的人工干预仅仅在于:vCJ品论天涯网

1.从模型生成的多个解法中,选择最优的那个进行提交vCJ品论天涯网

2.将模型与IOI的提交API进行连接vCJ品论天涯网

除此以外,所有的解题过程全部由AI自主完成vCJ品论天涯网

一年从差点青铜到稳拿金牌vCJ品论天涯网

SherylHsu提到,去年的IOI竞赛,OpenAI也曾尝试过,但结果并不理想,最终与一枚铜牌擦肩而过,仅排在49%分位。并且,去年的方案还动用了大量手工定制的测试时策略vCJ品论天涯网

而仅仅一年之后,OpenAI就实现了从49%分位到98%分位的大逆转,从差点青铜一跃成为金牌王者vCJ品论天涯网

GPT-5塌房,下一代模型什么时候发布?vCJ品论天涯网

最近几周,OpenAI这个神秘的内部推理系统模型可谓是捷报频传,在多个世界顶级智力竞赛中展现了强大实力:vCJ品论天涯网

AtCoder世界总决赛:取得第二名vCJ品论天涯网


vCJ品论天涯网

IMO2025(国际数学奥林匹克):宣称取得金牌vCJ品论天涯网

IOI2025(国际信息学奥林匹克):斩获金牌vCJ品论天涯网

那么这个内部推理系统是什么?下半年OpenAI还有真正的大招?vCJ品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱[email protected]