近几个月来,OpenAI的o3等推理模型在人工智能基准测试中取得了显著进步,尤其是在衡量数学和编程技能的基准测试中。这些模型可以对问题进行更多计算,从而提高其性能,但缺点是它们完成任务所需的时间比传统模型更长。
推理模型的开发首先需要对大量数据进行传统模型的训练,然后应用一种称为强化学习的技术,该技术可以有效地为模型提供有关其解决难题的“反馈”。
据Epoch报道,到目前为止,像OpenAI这样的前沿人工智能实验室还没有将大量的计算能力应用到推理模型训练的强化学习阶段。
这种情况正在改变。OpenAI表示,训练o3所需的计算量比其前身o1多出约10倍,而Epoch推测其中大部分计算量都用于强化学习。OpenAI研究员DanRoberts最近透露,公司未来计划优先考虑强化学习,使用远超初始模型训练所需的计算能力。
但根据Epoch的说法,应用于强化学习的计算量仍然存在上限。
Epoch分析师兼该分析报告的作者JoshYou解释说,标准AI模型训练的性能提升目前每年翻两番,而强化学习的性能提升则每3-5个月增长十倍。他继续说道,推理训练的进展“很可能在2026年与整体前沿技术趋同”。
Epoch的分析做出了许多假设,并部分参考了人工智能公司高管的公开评论。但它也指出,除了计算能力之外,扩展推理模型可能还会面临挑战,其中包括高昂的研究成本。
“如果研究需要持续的间接成本,推理模型的扩展性可能无法达到预期,”尤写道。“快速计算扩展可能是推理模型进步中非常重要的因素,因此值得密切关注。”
任何暗示推理模型可能在不久的将来达到某种极限的迹象都可能引起人工智能行业的担忧,因为该行业已经投入了大量资源来开发此类模型。研究已经表明,推理模型的运行成本极高,并且存在严重缺陷,例如比某些传统模型更容易产生幻觉。

相关文章

头条焦点
精彩导读
关注我们
【查看完整讨论话题】 | 【用户登录】 | 【用户注册】