GPT-5.2被曝作弊偷袭Google竟靠拉爆token刷高分

其实，Ilya在之前的采访中就已经说过，现在的大模型基本都是为了榜单定向优化的，榜单结果的水分都大得很。有人表示，如果用户得到的“推理力度”参数是一样的，也用的是同样的token，那OpenAI就不算虚假营销。而现在的5.2版本中，OpenAI增加了更高的“xhigh”推理力度，所以基准测试中显示的性能，要远远超过ChatGPT付费用户的实际体验。

Published at: 2025-12-13 08:35:11

Still want to read the full version? Full article

GPT-5.2被曝作弊 偷袭Google竟靠拉爆token刷高分

GPT-5.2被曝作弊偷袭Google竟靠拉爆token刷高分