GPT-5.2考赢人类 OpenAI警告：大模型能力已过剩，AGI天花板不是AI

其核心理念并不是训练一个更大的模型，而是通过软件层面的系统设计，自动构建“会调用模型的系统”。但Poetiq的加入，使GPT-5.2(X-High)的得分从60%直接拉升到了75%，从勉强及格（人类平均水平）迈入了优等生的行列（显著超越人类平均水平）。通过上面Poetiq所公布的Poetiq（GPT-5.2X-High）在ARC-AGI-2上的表现，75%的得分超过了人类平均水平（60%）15个百分点。

Published at: 2026-01-11 07:36:03

Still want to read the full version? Full article