Qwen3 发布 阿里也要靠多模态和性价比打天下了

Qwen3 发布 阿里也要靠多模态和性价比打天下了


旗舰模型 Qwen3-235B-A22B 拥有约2350亿的总参数量,在每次推理时仅仅激活约220亿参数,性能极其耐打,在综合能力、代码与数学、多语言能力、知识与推理等多项基准测试中,都能与DeepSeek R1、OpenAI o1、o3-mini、Grok 3和GoogleGemini 2.5 Pro等目前市场上的主流大模型相抗衡。 在预训练方面,Qwen3 的数据集相比 Qwen2.5 几乎翻了一倍,达到了3.6万亿个token,覆盖了更广泛的领域知识和语境,再度提升了在复杂任务处理和多语言场景中的表现。 他点出了DeepSeek庞大光环下,中国的大厂正在走向用性价比抗衡DeepSeek的现状:用更小参数,更低成本的方式,实现更快的响应,完成不属于DeepSeek的多模态效果。


Published at: 2025-04-29 12:05:14

Still want to read the full version? Full article