哈萨比斯的人类补完计划

在著名动漫《新世纪福音战士》里,碇源堂和他背后的SEELE组织始终在执行一项叫做“人类补完计划”的神秘行动。

这个计划到底是什么意思,粉丝们已经争吵了很多年。但大体上应该是说利用“神性”来补完人类族群,从而消除人类社会中的种种问题。也就是说,这个计划是“把人类补完的计划”。

但“人类补完”这个词,其实还可以有另一种解释,就是“用人类去补完某种东西的计划”。有东西需要用人类来补完吗?当然有,比如说人工智能。

号称AI研发实力地球第一的DeepMind,似乎就在执行着这样一个“计划”。我们知道,相比于大部分兴趣广泛的AI实验室型企业,DeepMind的专注点非常整齐。基本可以形容为:左手游戏,右手神经学;向下关注医疗落地,向上思考AI道德。

这样的方向选择,与DeepMind创始人哈萨比斯的个人经历与兴趣紧密相关。游戏我们已经看到了围棋和《星际争霸2》。还没有引发公众关注的,是这位天才右手中攥着的,学习人类大脑与神经来发展高等级人工智能的宏伟野心。

有野心不可怕,可怕的是,在不到一年的时间里,这个计划已经初现规模。

“狂人”的战役

大概地球上不会有第二个人,能够同时擅长人工智能、游戏、神经科学、创业这四件事。

关于“神童”哈萨比斯的事迹,媒体已经有了太多报道。比如他5岁参加国际象棋正式比赛,16岁进入剑桥学习人工智能,22岁创办了电脑游戏公司,以及后面DeepMind的系列“神迹”。

但媒体比较少关注的一件事,是这个被万维网之父蒂姆·伯纳斯·李称为“星球上最聪明的人之一”的人工智能专家,博士学位修的是认知神经科学。

2005年,已经沉浸人工智能多时的哈萨比斯,决定回到象牙塔中充电。在伦敦大学学院攻读神经学中,哈萨比斯发现了大脑海马体与人类情景记忆的关系。这固然是个关于人类记忆的重要发现,但要注意的是,其同时也影响了接下来很长一段时间内关于机器记忆的研究,尤其是在机器学习中的连续学习和长期学习。

其实在上世纪四五十年代,研究机器智能的专家,很多来自于神经科学与社会行为学。毕竟所谓人工智能,归根结底目标是让机器产生类似人类智慧的能力。但随着后来人工智能与计算机科学的联系日间紧密,神经科学也回到了生物学的研究序列中。

几十年间二者各自飞速发展,研究人员也越来越“专业”。直到统计学和数学开始笼罩AI研究,人工智能的底层研究似乎很大程度上变成了纯碎的函数问题。

显然,据说5岁就开始思考人工智能问题的哈萨比斯,对这种现象是非常不满的。DeepMind成立初期,始终在忙着让AI打游戏和完成棋类运动。而在2017年,AlphaGo终于无敌于天下,哈萨比斯却没怎么享受胜利果实,而是马不停蹄开始了一项长期计划的号召:人工智能必须继续向神经科学取经。

去年7月,哈萨比斯非常少见的亲手写下长篇文章,并且不是像往常一样发表在人工智能刊物,而是发表在了神经医学界的最高规格刊物《神经》中。

这篇《神经科学启发人工智能》,完全可以看做是一篇檄文。文中哈萨比斯开宗明义地表示,假如我们的目标是开发出接近或同等于人类智慧的智能技术,那么就绝不能放弃对人脑的研究和理解,因为人脑是唯一能够证明这种智慧存在的证据。同时他还历数了强化学习、迁移学习等10个神经科学可以启发AI研究的领域。

在哈萨比斯看来,今天学术界的过于封闭,已经限制了AI研究的发展。目前神经科学对人工智能的影响,更多来自于微妙的启发和科研成果借鉴,缺乏AI与神经科学的系统性结合,缺乏双向人才(比如哈萨比斯自己),更缺少两个领域有效、直接的沟通。所以他呼吁培养跨领域人才,希望建立共同的理论体系、话语机制和跨学科研究项目。

当然了,只呼喊不实干从来不是DeepMind与哈萨比斯的风格(事实上很少见到哈萨比斯如此努力呼吁某事)。在几个月时间里,DeepMind的科学家们已经浩浩荡荡把BOSS“学习神经科学”的主张实践了起来。

“科学狂人”这场“用人类补完AI”的战役,此刻已在高速运转中。

用成长心理学解释AI黑箱

去年6月,似乎为了与哈萨比斯的呼吁相配合,DeepMind团队发表了一篇论文,探讨用心理学中的某些现象和实验方法来解释AI的黑箱子问题。

我们知道,黑箱现象如今是困扰人类探索AI的主要问题之一。在经过复杂的神经网络计算之后,常常会出现人类无法搞懂算法的运作机制,不知道算法如何得出结论的问题。失控的机器智能当然不是好智能,但研究AI的判断与喜好却总是缺乏有效途径。

DeepMind的科学家们,想到了去心理学取经。心理学中有个专门学科,叫做成长心理学,研究幼儿成长过程中产生的心理、认知与记忆变化。这门学科中有个有意思的实验,是研究幼儿究竟是怎么记住兔子的?

告诉孩子什么是兔子,再重新找一只兔子让他识别,他记住的是什么呢?是颜色?形状?还是局部特征?最终心理学实验表明,人类幼儿总是偏向于通过形状来记忆新事物。

从中受到启发,DeepMind对AI模型进行了类似的实验,首先让模型记住一个物体,然后一面调整物体的颜色,一面调整物体的形状。最终结果表明,深度学习网络也与人类有相似的偏好:更喜欢根据形状来识别对象。

这种偏好是此前的AI研究中没有发现的,虽然它不能完全解释黑箱,但却给理解AI开启了全新的思路。更重要的是,类似的心理学研究与实验还有太多。也就意味着给AI做心理实验是有效而价值巨大的。

换句话说,这项研究成果表示,哈萨比斯希望在今天用神经科学补强AI,似乎有门!

用强化学习理解人类大脑

在哈萨比斯看来,不仅AI需要向神经科学学习,对人类大脑与神经的研究,在今天也需要向AI学习。

强化学习,是今天AI前沿研究中最火热的议题之一。这门技术希望用强化信号,来反复向智能体输出奖励机制,从而让神经网络不断做出优化选择,建立最优决策机制。AlphaGo Zero就强调用强化学习来快速达成高度成熟的围棋能力。

在9月和10月的两项研究中,DeepMind开启了全新脑洞:用强化学习机制来理解人类大脑。

比如在《自然》子刊《自然·人类行为》上发表的一篇论文中,DeepMind联合多院校的相关团队,一起探讨了人类决策行为时的后继表示(successor representation,SR)现象。实验结果显示,人类决策行为中,确实用到了缓存未来预期并映射到现实决策中的方案。这也是强化学习模式在人脑中工作的第一个证据。

另一篇发表在《自然神经科学》的论文中,DeepMind尝试用强化学习技术来探究人脑中海马体的工作方式。大脑中海马体能够作为空间定位器,负责帮人类认路,这已经是公认的事实。但是这样的解释却无法说明海马体是如何参与记忆、决策、推理等任务的。

DeepMind还是基于AI中强化学习技术的思路,设计了相关实验,来证明海马体的定位和指路能力,其实是一种有奖励机制和决策机制的强化学习过程。

相关证据表明,大脑海马体在指路中的作用,是建立在空间信息之上,对奖励最大化的选择。研究人员称其为“地图预测机制”。这也就解释了海马体参与其他人脑工作时的基本方式。

这两篇研究最有脑洞的地方在于:他们都是用强化学习机制来解释人脑的运作模式,并通过一些实验来证明自己的解释是正确的。同时又反过来阐释,假如人脑确实是以强化学习中的奖励机制来执行预测、记忆等基本智能。那么对人类大脑机制的研究与模仿,应该也可以加强对强化学习技术的理解和升级。

在同一个实验中,两个学科相互帮助携手进步,真的有点奇妙…

用心智理论,帮助机器理解彼此

如果说以上“用人类补完AI”的计划还停留在学术认识上,那么到了今年,DeepMind似乎已经准备好在AI技术本身放大招了。

就在上个月,DeepMind发表了他们如何让智能体理解智能体的研究“机器心智理论”(Machine Theory of Mind),并放出了相关模型。这毫无疑问意味着人类对AI可解释性的研究到了新的阶段。同时这也是我认为本文可以开始写作的原因之一。

什么是“心智理论”?

我们认为AI处于黑箱子中难以理解,但我们是怎么理解其他人类的呢?我们可以跟其他人交流,预测他人的行动和情感,甚至可以预测他人的消费行为...但我们没有把他们的大脑撬开,看里面的前额叶海马体脑皮层是如何工作的...原因就在于,我们是通过心智理解他人和自己的行为与情感。这就是心理学上的心智理论。

DeepMind希望利用这个心理学概念,让智能体观察和学习其他智能体的动作与行为,从而准确预测被观察者下一步的动作。通过不同等级智能体的观察实验,论文中已经展示出ToMnet理解并预测不同层级、不同底层技术智能体的能力。

换句话说,这项技术突破让AI成功的通过外部行动来理解AI,而不必将内在架构链接在一起。

事情到了这里,已经弥漫出一点失控的味道。假如未来机器可以像人类一样,通过交谈和行为理解彼此,那与人类好像也没多大不同了。

根据最近各方面的反馈看,机器心智理论(Theory of Mind neural network)——ToMnet的价值,很有可能不低于历史上任何一项人工智能技术突破。虽然有专家批评ToMnet并非是建立在知识空白的基础上去理解其他智能体,但这项技术突破的价值还是被广泛承认。

很多专家预测,接下来多智能体协同系统,机器交互,AI自我成长,这些关键领域很可能都要以ToMnet作为基础。

而这个突破的根源,却是来自心理学。

战鼓初鸣:关于补完计划的进度

让我们来总结一下哈萨比斯这场“用神经科学强化AI”行动的进度吧。

目前DeepMind相关研究专注于两个方面:强化学习、AI可解释性。整体研究围绕这两项技术来展开,既用心理学和神经科学来加强对AI黑箱的破解,同时也希望用强化学习等“AI原理”帮助探秘人类大脑。

整个计划的最大成绩,在于给跨学科研究做出了扎实的示范,证明了用神经学补全AI的可行性。非常关键的机器心智理论很可能带来惊喜,成为主流研究方向。而对于强化学习的探索,可能与机器决策、物理世界处理等AI领域的技术相结合。

还有一点值得注意,DeepMind开源了Psychlab平台。这是一个“智能体专用心理测试集”,可以让更多研究者尝试AI与心理学的结合。

整个计划也不是没有问题。比如哈萨比斯一度呼吁搭建双学科理论框架和标准学术话语,今天依旧未见踪影。由于没有带来极其惊人的大动作,大众对于这类技术所知也不多。此外,虽然哈萨比斯曾经怀疑过这一现象,但直到今天,神经科学与认知心理学对AI的影响依旧主要是启发性的,缺乏前沿技术成果的相互关照。

而放眼未来,与记忆相关的AI技术或许会成为DeepMind的研究重点。情景记忆、工作记忆、长期学习等技术很有可能成为突破方向。

最重要的是,2018年,我们很大概率会看到哈萨比斯在AI模仿人类神经与心智上搞个轰动社会舆论的“大动作”出来。

还有一个问题,哈萨比斯和DeepMind如此坚定地推动AI向神经科学学习,终极目的仅仅是为了强化AI技术吗?

在去年《神经》杂志上那篇形同宣言的文章中,哈萨比斯曾在结尾处畅想:通过人工智能来了解人类智慧,让人工智能与人类大脑形成比对,或许有可能“对人类心灵中一些最深刻和最持久的奥秘产生深刻的见解,例如创造力、梦想,甚至有一天能触及意识的本质。”

真至于此,是不是同样喜欢戴黑框眼镜的哈萨比斯和碇源堂,两个人的“人类补完计划”,也就没有什么不同了?

-----------------分页符-----------------

原文地址:http://blog.51cto.com/naojiti/2082686

时间: 2024-09-29 22:38:16

哈萨比斯的人类补完计划的相关文章

CodeVS1169 传纸条 [DP补完计划]

题目传送门 题目描述 Description 小渊和小轩是好朋友也是同班同学,他们在一起总有谈不完的话题.一次素质拓展活动中,班上同学安排做成一个m行n列的矩阵,而小渊和小轩被安排在矩阵对角线的两端,因此,他们就无法直接交谈了.幸运的是,他们可以通过传纸条来进行交流.纸条要经由许多同学传到对方手里,小渊坐在矩阵的左上角,坐标(1,1),小轩坐在矩阵的右下角,坐标(m,n).从小渊传到小轩的纸条只可以向下或者向右传递,从小轩传给小渊的纸条只可以向上或者向左传递. 在活动进行中,小渊希望给小轩传递一

【图论补完计划】poj 3463 (次短路计数 dijkstra)

Sightseeing Time Limit: 2000MS   Memory Limit: 65536K Total Submissions: 9127   Accepted: 3206 Description Tour operator Your Personal Holiday organises guided bus trips across the Benelux. Every day the bus moves from one city S to another city F. O

【图论补完计划】poj 3522 (最小生成树)

Slim Span Time Limit: 5000MS   Memory Limit: 65536K Total Submissions: 7933   Accepted: 4227 Description Given an undirected weighted graph G, you should find one of spanning trees specified as follows. The graph G is an ordered pair (V, E), where V

【图论补完计划】poj 2723(2-SAT)

Get Luffy Out Time Limit: 2000MS   Memory Limit: 65536K Total Submissions: 8688   Accepted: 3371 Description Ratish is a young man who always dreams of being a hero. One day his friend Luffy was caught by Pirate Arlong. Ratish set off at once to Arlo

【图论补完计划】poj 3635 (最短路变形)

Full Tank? Time Limit: 1000MS   Memory Limit: 65536K Total Submissions: 7427   Accepted: 2399 Description After going through the receipts from your car trip through Europe this summer, you realised that the gas prices varied between the cities you v

POJ1742 Coin [DP补完计划]

题目传送门 Coins Time Limit: 3000MS   Memory Limit: 30000K Total Submissions: 41707   Accepted: 14125 Description People in Silverland use coins.They have coins of value A1,A2,A3...An Silverland dollar.One day Tony opened his money-box and found there wer

补番计划 (长沙理工大学第十一届程序设计竞赛)(双端队列+set容器+string)

补番计划 Time Limit : 4000/2000ms (Java/Other)   Memory Limit : 65535/32768K (Java/Other) Total Submission(s) : 8   Accepted Submission(s) : 1 Font: Times New Roman | Verdana | Georgia Font Size: ← → Problem Description 阿聪是一个日漫狂魔.暑假在家的时候,他有12小时在补番,12小时在睡

JavaScript函数补完:toString()

javascript中的toString()方法,主要用于Array.Boolean.Date.Error.Function.Number等对象.下面是这些方法的一些解析和简单应用,做个纪律,以作备忘. Array.toString() 将数组转换成一个字符串,并且返回这个字符串. 描述:当数组用于字符串环境中时,javascript会调用这一方法将数组自动转换成一个字符串.toString()在把数组转换成字符串时,首先要将数组的每个元素都转换成字符串(通过调用这些元素的toString方法)

PHP函数补完:stream_context_create()模拟POST/GET

PHP函数补完:stream_context_create()模拟POST/GET PHP流的创建 在 2011年01月08日 那天写的     已经有 9408 次阅读了 感谢 参考或原文 服务器君一共花费了94.075 ms进行了3次数据库查询,努力地为您提供了这个页面. 试试阅读模式?希望听取您的建议 有时候,我们需要在服务器端模拟 POST/GET 等请求,也就是在 PHP 程序中去实现模拟,改怎么做到呢?或者说,在 PHP 程序里,给你一个数组,如何将这个数组 POST/GET 到另外