网友实测:GPT-5.2强得可怕也无聊得要命

网友实测:GPT-5.2强得可怕也无聊得要命


在各方深度试用三天,并横向对比了Claude 4.5和Gemini 3之后,我们得出了一个违背直觉的结论:它可能确实变“无聊”了,但这正是它变强的代价。 它不仅实现了测试人员要求的分享、定价等全部按钮,甚至生成了完整的订单表单和预约表单,增加了额外的深度和功能,考虑到了更多细节。 此外,Opus 4.5的训练还包含了一个被内部称为“灵魂文档”(Soul Document)的文件,其中明确了Anthropic的使命——开发安全、有益和可理解的AI,并警惕提示词攻击,这解释了为何Opus在安全性和指令遵循方面表现出色。


Published at: 2025-12-15 05:35:14

Still want to read the full version? Full article