人工智能

JetBrains 开源 120 亿参数 Mellum2 模型

字号+作者:cnBeta.COM 来源:cnBeta 2026-06-02 12:43 评论(创建话题) 收藏成功收藏本文

JetBrains近日宣布,将其面向软件工程系统的新一代机器学习模型Mellum2正式开源。这距离公司在2025年开源首个Mellum模型仅过去一年多时间,当时的Mellum是'...

JetBrains近日宣布,将其面向软件工程系统的新一代机器学习模型Mellum2正式开源。这距离公司在2025年开源首个Mellum模型仅过去一年多时间,当时的Mellum是一款专注代码补全的小型模型,参数规模约为40亿。与之相比,Mellum2的总参数量扩大到120亿,但JetBrains强调,通过采用稀疏专家混合(Mixture-of-Experts,MoE)架构,每个token实际参与计算的仅为约25亿活跃参数,从而在标准硬件上依然能够保持较快推理速度。ze5品论天涯网

ze5品论天涯网

与仅在编辑器中执行代码补全任务的“聚焦型”Mellum不同,Mellum2被定位为一款完整的智能编码助手。它既可以生成和编辑代码,也能调用外部工具,执行多步“Agentic”工作流,支持长对话,并具备显式推理能力。开发者可以在Apache2.0许可下使用其基础版、指令调优版和“思考版”模型,在构建产品或内部工具时保持对数据的完全控制。ze5品论天涯网

从规格上看,Mellum2相比初代Mellum在多个关键指标上有明显变化:原始Mellum采用的是稠密参数设计,而Mellum2转向MoE架构;总参数量从40亿提升至120亿,但活跃参数从40亿降至25亿;上下文窗口从8192token大幅提升到131072token,使其更适合处理长文档和复杂工程场景;两代模型均采用Apache2.0开源许可证。ze5品论天涯网

JetBrains表示,Mellum2特别适合用于路由与编排复杂的AI工作负载,构建低延迟的检索增强生成(RAG)管线,为大型系统中的子Agent提供快速推理支持,以及在本地或私有环境中部署AI。为进一步提升模型在代码与数学等专业领域的表现,团队在预训练阶段采用了三阶段数据“课程”,逐步从多样的Web数据迁移到更精心筛选的代码和数学内容。ze5品论天涯网

除Mellum2之外,JetBrains还公布了一项产品线调整:公司将停止维护面向Python开发者的数据科学IDEDataSpell。根据官方信息,DataSpell已于5月28日正式“退役”,相关的数据科学功能将被整合进入PyCharm专业版。现有的DataSpell有效订阅会在2026年9月1日自动转换到PyCharmPro。ze5品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱[email protected]