Qwen3 发布阿里也要靠多模态和性价比打天下了

旗舰模型 Qwen3-235B-A22B 拥有约2350亿的总参数量，在每次推理时仅仅激活约220亿参数，性能极其耐打，在综合能力、代码与数学、多语言能力、知识与推理等多项基准测试中，都能与DeepSeek R1、OpenAI o1、o3-mini、Grok 3和GoogleGemini 2.5 Pro等目前市场上的主流大模型相抗衡。在预训练方面，Qwen3 的数据集相比 Qwen2.5 几乎翻了一倍，达到了3.6万亿个token，覆盖了更广泛的领域知识和语境，再度提升了在复杂任务处理和多语言场景中的表现。他点出了DeepSeek庞大光环下，中国的大厂正在走向用性价比抗衡DeepSeek的现状：用更小参数，更低成本的方式，实现更快的响应，完成不属于DeepSeek的多模态效果。

Published at: 2025-04-29 12:05:14

Still want to read the full version? Full article

Qwen3 发布 阿里也要靠多模态和性价比打天下了

Qwen3 发布阿里也要靠多模态和性价比打天下了