奖励学习

奖励学习中的神经变化

一些个体在完成有具体目标的任务时能够比其他个体更成功地获得奖励,但有可能调控这种以奖励为目的的学习活动的神经变化却不是很清楚。Tye等人训练大鼠来自己管理一种蔗糖奖励,发现奖励学习依赖于杏仁核(大脑中一个对情绪学习很重要的区域)中增加的活动及突触力量。不同动物所达到的学习水平与突触力量增强的程度有很强关联。增强对奖励学习过程中大脑变化的了解,将有助于为自然奖励学习缺陷或失常的奖励学习症状如药物上瘾或饮食失调等制定治疗干预方案。

Further, the greater the

proportion of neurons recruited to encode the reward-predictive cue,

the better the rat learned the cue–reward association, and the more

successful the rat was at earning rewards.

Because our in vivo recordings showed rapidly occurring changes

in cue-related firing in the LA during successful cue–reward learning,

we proposed that the mechanism underlying these changes was an

increase in synaptic strength of thalamic or cortical sensory afferents

onto LA neurons; we tested this hypothesis with ex vivo experimentation

(Supplementary Fig. 6). Rats were trained on a single session of

the same behavioural model and classified as learners (top 50%) or

non-learners (bottom 50%) as defined by our learning indices of task

efficiency and task accuracy (Supplementary Fig. 7).

These findings provide evidence of

a connection between LA synaptic plasticity and cue–reward learning,

potentially representing a key mechanism underlying goaldirected

behaviour.

Basolateral amygdala (BLA) neurons are phasically responsive to

reward-predictive cues8–11, which is consistent with the idea that cueevoked

neuronal firing emerges as a consequence of cue–reward

associations.

Recognizing that a cue predicts a reward enhances an

animal’s ability to acquire that reward; however, the cellular and

synaptic mechanisms that underlie cue–reward learning are

unclear. Here we show that marked changes in both cue-induced

neuronal firing and input-specific synaptic strength occur with the

successful acquisition of a cue–reward association within a single

training session.

but the results are generally consistent in showing that  training results in activity changes within a network of

brain regions previously implicated in domain-general aspects of WM (e.g., dorsolateral prefrontal cortex,posterior parietal cortex, basal ganglia)

时间: 2024-10-10 22:12:57

奖励学习的相关文章

李飞飞、吴恩达、Bengio等人的15大顶级深度学习课程

目前,深度学习和深度强化学习已经在实践中得到了广泛的运用.资源型博客sky2learn整理了15个深度学习和深入强化学习相关的在线课程,其中包括它们在自然语言处理(NLP),计算机视觉和控制系统中的应用教程. 这些课程涵盖了神经网络,卷积神经网络,循环网络和其变体,训练深度网络的困难,无监督表示学习,深度信念网络,深玻尔兹曼机器,深度Q学习,价值函数估计和优化以及蒙特卡洛树搜索等多种算法的基础知识. 吴恩达:深度学习专项 这系列课程侧重于讲解深度学习的基础和在不同领域的运用方式,如医疗健康,自动

机器学习的动机与应用,监督学习与无监督学习

先抛出个例子,根据房子的面积来判断房子的价格. 什么是监督学习,大概了解就是有标准答案的训练,比如上面那个房子的问题,之前给的training examples都是一个x对应特定的y,就相当于有标准答案,这就是监督学习.supervised learning(我理解的) 无监督学习就是没有标准答案的,往往是会根据数据的某些特征分类,分群.(clustering) 强化学习 reinforcement learning,又称奖励学习,评价学习,key reward function.原理和训练狗一

mt学习linux的开始

我的名字是,高猛.90的.于2017-6-7在老男孩开始学习linux,路从这里开始. 我保证做到 1 每天认真听讲 2 认真完成作业 3 做好预习功课 4 做好复习总结 5 坚持每天学习 6 每周坚持只玩两次游戏 7 坚持锻炼身体 8 听话,跟着老师的安排学习 目标薪资是10K 完成目标奖励自己一台新的笔记本电脑. UN_black 2017.6.15

学习Linux的决心书

我是姜剑兵,现立下决心书!经过4个月的Linux运维学习后,我一定要达到1OK的月薪.为达成目标将采取以下行动: 1.  保证每天6:00起,学习10h以上(如有重要的事情处理,保证学习5h). 2.  一周跑步2-3次,每次5km以上. 完成奖励: 参加2017年杭州国际马拉松赛事.(从2014年开始每年都参加,今年不能断) 如未完成: 继续失业就是最大的惩罚. 保证人:姜剑兵 2017.5.20

学习决心书-linux oldboy  

我叫任代桥,参加老男孩教育linux运维网络班,目标5个月完成linux运维学业,目标薪水是14K,为了达到此目标我将努力做到一下几点,请大家监督: 1.期间不再碰LOL.dota2等任何游戏,不看电影,不看连续剧,戒掉网综 2.每天认真听讲,做好笔记,记好重点,专心跟着老师走. 3.课下积极总结,当日知识点,当日总结收获,做好小结并复习以前学的知识. 4.争取每天进行10小时及以上的学习时间,坚决不低于每天8个小时的学习时间. 5.遇到难题的时候自己先研究解决,再向导师请教. 6.多练习,多操

普通Java程序员学习使用的6个JDK内建工具

与你的问题不同,我认为软件工程主要是用来解决问题的.有些博客认为“每个小孩都应该学习编程”,“你认为学数学只是玩玩而已?如果你有看过我的HTML5调试器的话,你会发现我是一个程序员,但我做的工作远不止数学这些”. 上面两者都同意一个观点,软件工程不只是用计算机语言写的一些只言片语.软件解决的问题诠释了程序员的价值. 解决问题的最终进展来自科学.强化清晰的头脑和我们一路以来使用的工具. 你有没有留意过那些 JDK 安装附带的工具?既然那些大牛同意把那些工具加到 JDK 里,应该是有用的. 因此,在

nodejs学习资料

NodeJS基础 什么是NodeJS JS是脚本语言,脚本语言都需要一个解析器才能运行.对于写在HTML页面里的JS,浏览器充当了解析器的角色.而对于需要独立运行的JS,NodeJS就是一个解析器. 每一种解析器都是一个运行环境,不但允许JS定义各种数据结构,进行各种计算,还允许JS使用运行环境提供的内置对象和方法做一些事情.例如运行在浏览器中的JS的用途是操作DOM,浏览器就提供了document之类的内置对象.而运行在NodeJS中的JS的用途是操作磁盘文件或搭建HTTP服务器,NodeJS

学习Python的day1

自己以前从来没有写博客的想法,但是学Python,里面的老师也说了,写博客可以加深自己的记忆,也能回顾内容.还能给别人参考.挺值的.2017-09-16 一. Python介绍 python的创始人为吉多·范罗苏姆(Guido van Rossum).1989年的圣诞节期间,吉多·范罗苏姆为了在阿姆斯特丹打发时间,决心开发一个新的脚本解释程序,作为ABC语言的一种继承. 最新的TIOBE排行榜,Python赶超PHP占据第五, Python崇尚优美.清晰.简单,是一个优秀并广泛使用的语言. Py

linux老男孩学习决心书

大家好 我是老男孩linux40期学生,我叫郭鹏.毕业于石家庄职业技术学院. 家是农村的,非常清楚家里的苦,大学毕业后想通过自己的努力改变 家里的生活,毕业后从事与电气自动化本专业工作,后来觉得没什么前途, 辞职做起了销售,就这样飘了两年,一无所获.现在想找一个稳定高薪工作 ,听朋友介绍linux发展前景好,就来到老男孩学习. 毕业后期望北京薪资10k 决心书: 1.早睡早起,保持一个好的精神面貌听课 2.做到课前预习,课后总结. 3.按时按量完成老师交代的作业 4.不迟到,不早退,做一个遵守纪