人工智能

上海MiniMax开源模型登上全球第二 创始人:第一次感觉到大山不是不能翻越

字号+作者:快科技 来源:快科技 2025-07-03 12:50 评论(创建话题) 收藏成功收藏本文

在官网和开源平台GitHub上,上海国产AI独角兽MiniMax抛出全球首个开源大规模混合架构推理模型——MiniMax-M1。该模型在权威评测榜单已位列全球开源模型'...

在官网和开源平台GitHub上,上海国产AI独角兽MiniMax抛出全球首个开源大规模混合架构推理模型——MiniMax-M1。该模型在权威评测榜单已位列全球开源模型第二。M1发布当天,MiniMax创始人兼CEO闫俊杰在朋友圈写下:第一次感觉到大山不是不能翻越。Q6F品论天涯网

M1一登场,即在权威评测榜单中位列全球开源模型第二,仅次于5月28日发布的DeepSeek-R1-0528。不过从细分项来看,M1在长文本处理、工具调用等方面形成碾压级优势。Q6F品论天涯网

Q6F品论天涯网

M1支持高达100万token的上下文输入能力,相当于可以一次性处理整部《三体》英文原著,这一性能达到DeepSeek同类模型的8倍,甚至可与谷歌最新闭源模型Gemini2.5Pro相媲美。更令人瞩目的是,在保持顶尖性能的同时,其强化学习阶段仅投入53.5万美元,远低于行业常规的千万级研发成本。Q6F品论天涯网

Q6F品论天涯网

MiniMax展现出惊人的研发速度和产品化能力。在M1发布后的短短四个工作日内,公司连续推出视频生成模型Hailuo02、通用智能体MiniMaxAgent、视频创作智能体HailuoVideoAgent以及音色设计工具VoiceDesign等多款创新产品,保持着令人瞩目的"日更"节奏。Q6F品论天涯网

这家扎根上海徐汇的AI企业始终保持着独特的技术路线。早在2022年底ChatGPT引发全球关注之前,MiniMax就已布局通用人工智能(AGI)领域,并果断放弃当时主流的大模型稠密架构和传统注意力机制。在全球大模型研发企业普遍收缩的行业背景下,MiniMax逆势坚持基础模型研发的战略选择,最终换来了这次具有里程碑意义的技术突破。Q6F品论天涯网

Q6F品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱[email protected]