该模型基于 Qwen3-Next-80B-A3B-Base 构建,采用混合注意力与 MoE 的新架构;通过大规模可执行任务合成、环境交互与强化学习进行智能体训练,在显著降低推理成本的同时,获得了强大的编程与智能体能力。 下图汇总了在多个广泛使用的编程智能体基准上的表现,包括 SWE-Bench(Verified、Multilingual、Pro)、TerminalBench 2.0 和 Aider。 尽管专有的全注意力模型在绝对性能上仍然领先,Qwen3-Coder-Next 在面向低成本智能体部署方面处于强势的帕累托前沿。
Published at: 2026-02-03 22:47:54
Still want to read the full version? Full article