从最初的极度不确定,到一路克服各种看似不合理的困难,靠着持续的努力,团队现在终于看到了实现使命的希望。 从最初的极度不确定,到一路克服各种看似不合理的困难,靠着持续的努力,我们现在终于看到了实现使命的希望。 2017 年,我们取得了几项奠基性的成果:Dota 1v1,让我们把强化学习推向了前所未有的规模;无监督情感神经元,让我们第一次看到语言模型确实在学习语义,而不仅仅是句法;基于人类偏好的强化学习,展示了让 AI 与人类价值对齐的初步路径。
Published at: 2025-12-13 09:03:56
Still want to read the full version? Full article