人工智能

月之暗面发布首个自主强化学习Agent 性能超OpenAI、Gemini

字号+作者:快科技 来源:快科技 2025-06-23 10:25 评论(创建话题) 收藏成功收藏本文

月之暗面(MoonshotAI)正式推出其首款Agent产品——Kimi-Researcher(深度研究),并已启动小范围灰度测试。该产品基于端到端自主强化学习(end-to-endagenticRL)'...

月之暗面(MoonshotAI)正式推出其首款Agent产品——Kimi-Researcher(深度研究),并已启动小范围灰度测试。该产品基于端到端自主强化学习(end-to-endagenticRL)技术打造,在HLE测试中表现优异,性能超越Claude4Opus、Gemini2.5Pro及OpenAIDeepResearch,并与Gemini-Pro的DeepResearchAgent持平。bic品论天涯网

Kimi-Researcher是一款高度自主的智能研究助手,能够独立规划任务流程并交付完整结果。与其他Agent不同,它采用零结构设计,无需复杂提示词或预设流程,完全依靠自主决策能力在动态环境中运行。bic品论天涯网

例如,它能自行判断信息冲突时的权衡策略、任务节点的切换时机,以及中间信息的取舍标准,其核心驱动力始终是任务的实际解决效果。bic品论天涯网

作为一款深度研究模型,Kimi-Researcher整合了多源数据,并支持每条引用的直接追溯,确保研究严谨性,有效减少幻觉问题。月之暗面表示,未来将逐步开源Kimi-Researcher的基础预训练模型及强化学习优化版本,以推动Agent强化学习领域的探索与发展。bic品论天涯网

bic品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱[email protected]