GPT-5.2被曝作弊 偷袭Google竟靠拉爆token刷高分

GPT-5.2被曝作弊 偷袭Google竟靠拉爆token刷高分


其实,Ilya在之前的采访中就已经说过,现在的大模型基本都是为了榜单定向优化的,榜单结果的水分都大得很。 有人表示,如果用户得到的“推理力度”参数是一样的,也用的是同样的token,那OpenAI就不算虚假营销。 而现在的5.2版本中,OpenAI增加了更高的“xhigh”推理力度,所以基准测试中显示的性能,要远远超过ChatGPT付费用户的实际体验。


Published at: 2025-12-13 08:35:11

Still want to read the full version? Full article