| | | | | | |
  当前位置:首页 > 生物神经计算-第9期 

基底神经节强化学习的Actor-Critic模型:从自然大鼠到人工大鼠
作者:数学建模与神经计算 发布日期:2020-6-26
 点击:1124
关键词:-animat方法;TD学习;Actor-Critic模型;S-R任务;分类单元导航

基底神经节强化学习的Actor-Critic模型:从自然大鼠到人工大鼠

Actor–Critic Models of Reinforcement Learning in the Basal Ganglia: From Natural to Artificial Rats

Mehdi Khamassi1,2, Loïc Lachèze1, Benoît Girard1,2, Alain Berthoz2, Agnès Guillot1

1AnimatLab, LIP6, Paris, France

2LPPA, CNRS–Collège de France, Paris, France

Song Jiantranslate

1995年以来,许多针对强化学习的Actor-Critic架构被提出作为大鼠基底神经节类多巴胺强化学习机制的模型。然而,这些模型通常在不同的任务中进行测试,因此很难比较它们对自主“动作规划者”animat)的效率。在这里,我们将比较一个“动作规划者”中的四个架构,因为它执行相同的“奖励-寻找”(reward-seeking)任务。这将说明不同的假设对不同的Actor子模块和Critic单元的管理的后果,以及它们或多或少自主决定的协调。我们说明了,“专家”混合协调模块的经典方法,根据每个模块的性能,不允许解决我们的任务。然后,我们讨论了如何有效地应用哪种原理来组合这些单元。最后从我们的Psikharpax项目的角度讨论了Critic模型的改进和自然任务的Actor-Critic模型的准确性。该项目是一只人工老鼠,必须在不可预测的环境中自主生存。


翻译稿件【基底神经节强化学习的Actor-Critic模型:从自然大鼠到人工大鼠】

翻译原件Actor–Critic Models of Reinforcement Learning in the Basal Ganglia: From Natural to Artificial Rats

收 藏 推 荐 打 印 关 闭
上一篇:基底神经节做什么?建模的角度来看 下一篇:基底神经节的机器人模型:行为选择与内部处理
   关于我们
s
s
   推荐产品
   图片文章
   最新资讯
二次整合和放电神经元网络中的跨尺度兴奋性
具有二阶突触的精确和启发式神经质量模型...
一个具有突触延迟的大的峰值神经元系统的...
具有短期突触可塑性的峰值神经元网络的平...
排斥抑制在兴奋网络同步中的协同效应
具有双峰异质性的二次整合-触发神经元网...
 
友情链接: 神经计算   国家自然科学基   华南理工大学   全国大学生数学   美国数学建模竞   MATLAB  
咨询热线:刘教授 13650823684 邮箱:liushenat@sohu.com 备案编号:豫ICP备18005949号
地址:广州市番禺区广州大学城 邮编:510006  本站域名:mashqliu.com
Copyright © 2018-2024 数学建模与神经计算 Inc, All Rights Reserved.
在线客服
刘教授 13650823684
客服代表
点击这里给我发消息