评估自由选择权的强化学习机制---[数学建模与神经计算]

评估自由选择权的强化学习机制

A Reinforcement Learning Mechanism Responsible for the Valuation of Free Choice

Jeffrey Cockburn,¹ Anne G.E. Collins,¹ and Michael J. Frank^1,*

^{¹Department of Cognitive, Linguistic and Psychological Sciences; Brown
Institute for Brain Science, Brown University, Providence, RI 02912, USA}

Accepted: 2014 by Neuron

摘要：比起同等价值没有选择的选项，人们更喜欢自由选择的选项。然而，驱动这种偏好的神经机制及其功能意义尚待确定。在这里，我们提出了一个模型，在该模型中，由于与自由选择相关的正向奖励预测误差的放大而产生选择偏好。使用概率学习任务的新变体，我们表明选择偏向对主要与积极结果相关的选择具有选择性。发现DARPP-32的一个多态性是一个与多巴胺能纹状体可塑性和强化学习中的个体差异相关的基因，可以预测选择的价值效应。我们认为这些选择偏好是信用分配机制的行为副产品，该信用分配机制负责确保向纹状体发送有效的多巴胺能强化学习信号。

翻译稿件：评估自由选择权的强化学习机制

翻译原文：A Reinforcement Learning Mechanism Responsible for the Valuation of Free Choice