发布 Qwen3，阿里云拉开新一轮开源模型竞赛的序幕

值得注意的是，这次 Qwen3 的发布，主打混合推理，但是需要思考的长度最短也是 1024tokens，否则如果问题所需要的推理预算用不满 1024tokens，根本感受不到可以调节精度的混合推理模型的好。 Sam Altman 在更早的时间看到，当前的模型和产品供应已经变得非常复杂，希望 AI 能「开箱即用」、简化产品供应，「我们和你一样讨厌模型选择器，想要回归神奇的统一智能，之后，我们的一个重要目标是通过创建能够使用我们所有工具、知道何时需要长时间思考或不需要的系统，统一 o 系列模型和 GPT 系列模型，整体上能广泛适用于各种任务。虽然新一代模型能力的强弱，还要等待 Llama 和 DeepSeek 的发布，但值得关注的是，这三家开源模型厂商的生态策略亦有差异，这点从模型的侧重点就能看出端倪。

Published at: 2025-04-30 15:40:40

Still want to read the full version? Full article