对抗行为学习(OpAL)：纹状体多巴胺在强化学习和选择激励的交互作用下建模--多巴胺，纹状体，强化学习，选择动机，计算模型-[数学建模与神经计算]

对抗行为学习(OpAL)：纹状体多巴胺在强化学习和选择激励的交互作用下建模

Opponent Actor Learning (OpAL): Modeling Interactive Effects of Striatal Dopamine on Reinforcement Learning and Choice Incentive

Anne G. E. Collins and Michael J. Frank

^{¹Department of Cognitive,
Linguistic and Psychological Sciences, Brown Institute for Brain Science, Brown
University.}

Accepted: 2014 by Psychological Review

摘要：纹状体多巴胺能系统与强化学习(RL)，运动表现和激励动机有关。已经有人提出了各种计算模型来单独考虑这些影响中的每一种，但是缺乏对其相互作用的正式分析。在这里，我们提出了一种新颖的算法模型，该模型将经典的行为评论体系结构扩展到包括神经回路模型的基本交互属性，并将激励和学习效果都整合到单个理论框架中。标准行为被代表不同纹状体种群的双重对抗行为系统所代替，该系统以不同的方式专门区分正向行动值和负向行动值。多巴胺调节每个行为成分对学习和选择偏好做出贡献的程度。与标准框架相比，该模型在包括概率学习，基于努力的选择和运动技能学习在内的各种研究中，同时捕获了多巴胺对学习和选择动机及其相互作用的文献记载的影响。

翻译稿件：对抗行为学习(OpAL)：纹状体多巴胺在强化学习和选择激励的交互作用下建模

翻译原文：(OpAL): Modeling Interactive Effects of Striatal Dopamine on Reinforcement Learning and Choice Incentive