值得注意的是,这次 Qwen3 的发布,主打混合推理,但是需要思考的长度最短也是 1024tokens,否则如果问题所需要的推理预算用不满 1024tokens,根本感受不到可以调节精度的混合推理模型的好。 Sam Altman 在更早的时间看到,当前的模型和产品供应已经变得非常复杂,希望 AI 能「开箱即用」、简化产品供应,「我们和你一样讨厌模型选择器,想要回归神奇的统一智能,之后,我们的一个重要目标是通过创建能够使用我们所有工具、知道何时需要长时间思考或不需要的系统,统一 o 系列模型和 GPT 系列模型,整体上能广泛适用于各种任务。 虽然新一代模型能力的强弱,还要等待 Llama 和 DeepSeek 的发布,但值得关注的是,这三家开源模型厂商的生态策略亦有差异,这点从模型的侧重点就能看出端倪。
Published at: 2025-04-30 15:40:40
Still want to read the full version? Full article