本节阅读感言:一朝被蛇咬,十年怕井绳。我们的大脑时刻跟新着本体的预测机制。
上一节提到的喇叭,苹果汁实验可以不断的延伸扩展,在播放喇叭前用强光照射。。。强光照射前放置特定的图片。。。都可以扩展多巴胺相应的“预测能力”。在事情都是按照预测发生时,多巴胺细胞受到正面响应而增加多巴胺的释放,而事情与预测相反时,他们就受到打击,减少多巴胺的释放。
大脑被设计成会对与预测不符的模式具有强烈的反应。无论是在看到与往常不同的雷达信号,还是没有获得苹果汁,大脑都能能迅速的注意到。然后产生一种强大的情感:惊讶。
这种情感传递的过程始于大脑中央一个极小的,密布多巴胺神经元的区域。前扣带皮层负责着错误预测的机制,每当大脑发现不符合它的预测的现象时,这个部分立即发射出负面情绪的信号。
在前扣带皮层传递意识信号的同时,他同时也向负责机体行为的丘脑下部传递信号。当前扣带皮层在为一些现象所担心时,这一过程会导致机体的反应:肌肉紧张,心跳加快,肾上腺素分泌加大。这是前扣带皮层在告诉本体“没有时间浪费了,事态非常紧急!”
前扣带皮层不仅仅负责着错误预测机制,他还会帮助大脑记忆多巴胺单元学习到的一些事件。使得新线索,事件出现时,大脑不用重新重组整个事件,而是继续在原来的链条上添砖加瓦。它实时跟新着本体的神经连接模式。如果预测会有苹果汁,但是苹果汁数次都没有出现,前扣带皮层就会跟新他的预测机制。实际上,它不断的将短期感觉固化为长期性的神经模式。
这样的机制是制定决策时很重要的组成部分。如果我们不能从过去的经历中获得未来做决定的助力,那么我们注定陷入同样错误的无限循环。通过手术的方式去掉猴子的前扣带皮层后,它的行为变得不稳定而低效率。猴子再也不能预测即将到来的奖励,也搞不清楚周遭到底是些什么东西。牛津大学的研究人员做了这样的实验:一个猴子拿着一个手柄,这个手柄支持两种运动模式,(上下和旋转)只有触发了其中特定的一种运动模式才会得到食物奖励。更有趣的是:实验者在猴子每做过25次尝试后,就改变触发食物的运动模式。这使得希望获得食物的猴子要不断变化他的策略方能成功。
猴子们做了什么?前扣带皮层未被切除的猴子们做的很成功,他们可以在奖励性的运动模式切换后,做了几次尝试发现无果后,立即切换到另一种尝试方式。而没有前扣带皮层的猴子们则不是这样:它们也能在奖励性的运动模式切换后,数次无果而换到另一种尝试,但是,他们无法坚持这种新的成功策略。而是成功一次后,继续回到原来的错误方式。它们失去了跟新预测机制的能力。
一些在基因方面有缺陷导致多巴胺受体较少的人会变现出同样的缺陷:他们很少从负面经历中获得教训。多巴胺受体的数量稀少会引发严重的问题:极易陷入毒瘾与酒瘾。由于他们很难从错误中学习,他们总是一次又一次犯同样的错误。
前扣带皮层还有一个非常重要的作用:生产纺锤体神经元,与其它的脑细胞不同,他们的生存能力非常强。只有在人与高级猿类才有这种神经元,他们的功能非常特殊:通过天线一样的触角,将情感在整个大脑内传播。极其少量的纺锤体神经元在机体行动中承担了重要的责任。“你百分之99.9没有注意到这些多巴胺相关系统的工作。”Read Montague,贝勒大学的教授说到。“但是你百分之99.9被他们向大脑其它部分传递的信息而驱动机体行为。”
从以上我们可以理解我们的情感机制是多么的智能,他们不仅仅是简单的反射。他们有着高度灵活的预测机制,可以根据所处环境的改变,动态改变他们的连接模式。每当我们学习一个新知或者受到了一个挫折,这些相关的大脑单元是非常忙碌的。他们是很好的观察者。
晕船,晕车很大一部分的原因是多巴胺预测机制的错误:因为我们正处于一种与习惯的运动模式高度不同的模式中。当经过多次乘坐同样的交通工具后,预测系统修正了他们的的预测机制。之后,晕车、船的效果将大大降低。这就是海上航行的晕船持续不了过久的原因。
当多巴胺系统崩毁时,精神疾病就会出现。精神分裂症产生的原因至今未知,但是有一种情况会导致它:某一种多巴胺受体数量过大。这将导致多巴胺系统过度反应并分泌失调。使得本体无法正确的做出预测。(很多精神药品是通过抑制多巴胺分泌来工作的。)本体会产生和往常完全不一样的预测机制。使得他们的行为与情感和往日完全不同。
多巴胺相关的神经系统是极其重要的,当他们正确工作时,他们是智慧非常重要的来源。大脑的感性部分可以毫不费力的对事物产生各类结论。每当我们有各种各样的体验的时候,我们的神经细胞都在忙碌的进行重组,被组织成记忆。
Gerald Tesauro ,IBM的程序员,在90年代着力于研人工智能技术。当时的很多人工智能技术都完全基于计算机暴力的计算能力,比如深蓝,每秒计算200万种下一步的策略,从中挑选最优解。Tesauro认为当时大多数计算机通过记录棋谱,算最优解的方式不能说是对人类认知系统的模拟。Tesauro开始建立一种新型的人工智能机器,命名为TD-Gammon(PS:可以百度一下)。深蓝在被编程后就是一个下棋大师,而TD则在知识上从0开始。最开始,他下棋的方式是完全随机的,输掉了每一场比赛,并且总是犯愚蠢的错误。但是TD并不是一直是一个新手,TD被设计成能从经历中学习,TD日夜的从比赛中学习,不断的分析什么样的行动是高效的。经过了数十万场比赛后,TD击败了最优秀的人类选手。
TD是如何成为专家的?尽管数学原理非常复杂,原理是简单的。TD会对接下来的行为产生一系列的预测,就像人类一样。和深蓝不同的是,这种预测是通过过去的经验得出的。他将当初的预测与局势的结果加入到运算,从而给预测机制提供正负向的加强。使机器变得越来越智能。
最近,同样的软件策略被用在了很多复杂问题上。与传统程序不同的是,这种程序通过使自己不断成长以趋近真正正确的问题解决方式。