论文部分内容阅读
强化学习和决策理论作为机器学习的一种主流模型着重于阐述在复杂的环境中如何实现利益最大化。过去20年中,此类模型在理解和预测动物行为和脑活动方面取得了巨大的成功。运用功能性核磁共振成像技术,我们研究了强化学习模型中的两个重要组成部分:学习速度和预测误差如何被大脑特定区域的活动所编码。我们的研究表明,基地神经节和纹状体的血氧含量依赖水平(BOLD)信号分别与预测误差以和学习速度成显著性正相关。同时,当决策不仅仅依赖于周围环境中的奖赏信息时,大脑倾向于权衡所获得信息的相关程度,从而调节脑中强化学习系统的参与程度。