其核心理念并不是训练一个更大的模型,而是通过软件层面的系统设计,自动构建“会调用模型的系统”。 但Poetiq的加入,使GPT-5.2(X-High)的得分从60%直接拉升到了75%,从勉强及格(人类平均水平)迈入了优等生的行列(显著超越人类平均水平)。 通过上面Poetiq所公布的Poetiq(GPT-5.2X-High)在ARC-AGI-2上的表现,75%的得分超过了人类平均水平(60%)15个百分点。
Published at: 2026-01-11 07:36:03
Still want to read the full version? Full article