JetBrains宣布开源新一代机器学习模型Mellum2,定位为面向软件工程系统的智能编码助手。该模型在Apache2.0许可下提供基础版、指令调优版和“思考版”,开发者可在产品或内部工具中保持对数据的完全控制 。

Mellum2延续上一代模型的方向,但在架构与规模上进行了明显调整。初代Mellum于2025年开源,主要用于代码补全,参数规模约40亿 。新版本的总参数量提升至120亿,同时采用稀疏专家混合MoE架构,使每个token的活跃参数约为25亿,从而在标准硬件上保持推理速度。
与仅执行补全任务的初代不同,Mellum2具备生成与编辑代码、调用外部工具、执行多步Agentic工作流、支持长对话及显式推理等能力,功能覆盖完整的智能编码场景 。
在规格方面,Mellum2的上下文窗口扩展至131072token,适用于长文档与复杂工程环境。相比之下,初代模型的上下文窗口为8192token。两代模型均采用Apache2.0许可,但Mellum2从稠密结构转向MoE架构,活跃参数量也从40亿降至25亿 。
JetBrains表示,Mellum2适用于构建低延迟RAG管线、为大型系统中的子Agent提供推理支持,以及在本地或私有环境中部署AI。模型在预训练阶段采用三阶段数据课程,从通用Web数据逐步过渡到更精筛的代码与数学内容,以提升专业领域表现 。

除模型更新外,JetBrains还公布产品线调整:面向Python开发者的数据科学IDE DataSpell已于5月28日停止维护,相关功能将整合进入PyCharm专业版。现有DataSpell订阅将于2026年9月1日自动转换为PyCharmPro 。