不过 Open Philanthropy 的研究员 Alex Lawsen 对此提出详细反驳,认为苹果的结论源于实验设计缺陷,而非模型推理能力的根本性局限。 争议的焦点是苹果论文指出,即便是当前最先进的大型推理模型,在处理汉诺塔问题(Tower of Hanoi)等复杂任务时,也会出现彻底失败的情况。 Open Philanthropy 的研究员 Alex Lawsen 近日发布反驳文章《The Illusion of the Illusion of Thinking》,认为苹果的研究结果更多反映了实验设计的缺陷,而非模型推理能力的真正局限。
Published at: 2025-06-13 23:52:23
Still want to read the full version? Full article