![]()
作者 | 柴旭晨
编辑 | 周智宇
迅猛迭代的AI似乎正迎来一次关键的转折。
9月11日,在2025 Inclusion·外滩大会,“强化学习之父”理查德·萨顿(Richard Sutton)指出,AI行业处在“人类数据时代”,今天大多数机器学习的目的,是把人类已有的知识转移到一个静态、没有自主学习能力的 AI 上。
问题在于,这一路线下,人类数据红利正逼近极限,而持续学习对智能的效用至关重要。他认为,AI正在进入以持续学习为核心的“经验时代”,潜力也将远超以往。
萨顿在发言中表示,我们正进入“经验时代”,需要一种由智能体与世界直接交互中生成的新数据源。这正是人类和其他动物的学习方式,也是近期AlphaProof在国际数学奥林匹克斩获银牌的路径。
萨顿解释,“经验”指的是观察、行动和奖励,这三种信号在智能体与世界之间来回传递。“知识来自于经验,可以从经验中学习。一个智能体的智能程度,取决于它能预测并控制自身输入信号的程度。经验是一切智能的核心与基础。”
他同时指出,强化学习