破解图灵测试之困,量化分析机器与人类智慧之争

作者:刘锋

1.关于机器与人类智慧未来的分歧

2011年2月18日,超级电脑“沃森”打败了人类,站在了与人类智力竞赛的最高领奖台上。著名的未来学家库兹韦尔相信,由于信息技术正朝着“超人类智能”的奇点迈进。当这个信息奇点在2045年到来的时候,人工智能将超越人类智慧。

但也有不少科学家认为机器智慧超越人类智慧还只是一个科学幻想,包括麻省理工的计算机学教授罗勃?米勒(Rob Miller),Facebook人工智能实验室主任、深度学习专家Yann LeCun,都认为机器算法在一些领域的确超越了人类的能力范围。但在一些领域,例如对社会和文化的认知领域,包括不断发明各种新词汇、传播小猫的视频并点赞,或一起参与构的其他文化现象。这些是机器算法很难企及的领域。

1950年,图灵发表题为《机器能思考吗?》的论文,第一次提出“机器思维”的概念。提出假想:一个人在不接触对方的情况下,通过一种特殊的方式,和对方进行一系列的问答,如果在相当长时间内,他无法根据这些问题判断对方是人还是计算机,那么,就可以认为这个计算机具有同人相当的智力,即这台计算机是能思维的。这就是著名的“图灵测试”(Turing Testing)。

图灵测试经常用来检验机器是否具备人的智能,但图灵测试受人为因素干扰太多,严重依赖裁判者和被测试者的主观判断,而且只判断机器是否具备了人的智能,但机器与人类智慧的差距和变化速度并不能得到定量的分析。因此往往有人宣称其程序通过图灵测试,例如2014年6月英国雷丁大学客座教授凯文?沃维克宣称一款名为“尤金?古特曼(Eugene Goostman)”的计算机软件通过了测试,但很快就被人揭发他们的测试有很大漏洞并由欺诈嫌疑。

那么有没有一种方法,能够定量检测机器智力的发展水平和速度,并与人类智力进行对比,观察可能潜在的风险并进行防范。2013年以来我们在机器与互联智商方向进行了探索,初步成果已经发表在2014年6月6日举办的ITQM会议上,下面我们将简要介绍如何定量分析机器与人类智慧的未来之争。

2.机器与人类智商通用测试方法(M&H IQ)

在心理科学中,智力(intelligence)是最难理解的概念之一。目前有关智力的定义累积起来不下百种,但一个基本共识是,智力是人们认识客观事物并运用知识解决实际问题的能力。

对人类智力的测量即智商测试由比奈西蒙最早提出,1905年比奈西蒙发表了《诊断异常儿童智力的新方法》, 即比纳西蒙智力量表,标志着智力测验的正式出现。 1916年,美国斯坦福大学教授推孟(L.M. Ter man)将比纳西蒙量表介绍到美国并予以修订,修订之后的量表称为斯坦福比纳量表,它成为目前世界上广泛流传的标准测验之一。

因为目前机器智力发展还很不完善,不能完全套用对人的智商测试。几乎没有任何机器系统能够完成人类智商测量的操作能力测试,因此我们需要吸收以上智商测试量表的优点,设计新的智力评价体系和建立测试题库。使之能同时对机器系统和不同年龄阶段的人类进行测试。这样得出的结果将可以定量的看出机器智慧与人类智慧的差距,通过定时测试,也可以发现机器智慧与人类智慧差距的变化情况。

基于“智力是人们认识客观事物并运用知识解决实际问题的能力”这一基本认知,可以从知识的获取能力(观察能力),知识掌握能力,知识创新能力,知识的反馈能力(表达能力)等四大方面建立新的机器与人类通用智商评价体系,从这四个方面建立15个分测试,并采用德尔菲法对其赋予权重。

具有机器智慧的程序有很多种类,其中搜索引擎具有很强的代表性,作为目前互联网最重要的应用之一,搜索引擎代表有Google,Baidu,Bing等,这些搜索引擎目前在通过各种方式不断提高搜索引擎的智能水平。

例如 1.从只能识别文字增加到能够识别声音和图片;2引入“语义理解”技术,试图理解用户的搜索意图;3,通过深度学习,让搜索引擎可以自动识别图像中是什么物体。因此选择对搜素引擎进行智商测试并与人类进行对比将具有典型的意义。

3.世界搜索引擎排名与机器智慧的弱点

根据机器与人类通用智力量表,可以建立机器与人类通用智商测试题库(因为篇幅问题,本文不进行详细介绍),2014年5月我们利用这个测试题库对全世界50个搜索引擎和3个不同年龄阶段的人类群体进行测试得到结果如下

通过测试我们发现搜索引擎在知识的掌握能力上远远超过人类,但在知识的创新能力上全部得分为0. 由于知识创新能力在通用智商测试(M&H IQ)的权重更高,因此世界范围的搜索引擎的总体智商大大低于人类智慧,最高的Google的智商值也不到人类6岁儿童的一半。

从上述研究还可以看出智能或智力是由不同的因素组成,例如天文,地理,历史等常识,数学计算,语言翻译。这些方面机器或互联网已经远远超过普通人类的能力,甚至强大到令人恐怖的地步,这也是库兹韦尔的观点能够震慑住很多人的主要原因。

但我们往往忽略,除此之外,智力还包括猜测预测,排列组合,规律发现,创新创造,伪装欺骗等更高等级的智慧因素,而在这些方面,机器和互联网表现的基本为0,更不用说与婴儿比较。

从科技的发展看,低端的智能,机器的能力突飞猛进,高端的智能,机器的能力举步维艰,数十年来毫无进展,未来的智慧世界应该是机器与人类的分工,低端重复性的智能由机器承担,高端的创造性的智能由人类来承担。过分的宣扬机器智慧超越人类智慧,正如Facebook人工智能实验室主任Yann LeCun所说“人工智能的每一个新浪潮,都会带来这么一段从盲目乐观到不理智最后到沮丧的阶段。未来学家生来就愿意做出盲目的预测,尤其是他们特别渴望这个预测成真的时候,可能是为了实现个人抱负。”,

最后需要指出,目前建立的机器与人类通用智商测试量表(M&H)还有很大的改进空间,但希望这是一个起点,能够解决图灵测试的不足和缺陷,为定量分析机器智慧能否超越人类智慧打下初步的基础。

本文首发在网易科技,转载请注明出处。文章仅代表个人观点。更多互联网前沿科技文章欢迎关注微信号ITXlab

破解图灵测试之困,量化分析机器与人类智慧之争

时间: 2024-12-27 19:18:57

破解图灵测试之困,量化分析机器与人类智慧之争的相关文章

量化分析

学习目标 金融量化简介 数据分析简介 常用库简介 1.学习目标 ? 谈到金融量化分析,可能大多数人想到的肯定就是海量的股票数据,交叉错乱的股票数据图表,让从未接触过金融的人无法入手,就会想这种东西我怎么可能学的会.但是在我们有着扎实的Python编程基础就完全不需要担心这些东西了,我们只需要通过编程的方式编写出对应的策略就能通过计算机帮我们进行自动化交易. ? 从本文的标题当中就可以看到,我们的目标就是金融量化分析,在前面已经简单介绍过金融了,所以说我们就直接来看量化,量化这个词在当前这个时代已

为什么我最后选择做量化分析

如题,作为一个自我探索者,我高中参加过noip并获得省级二等奖,大学做微电子,毕业以后做过新闻类的数据挖掘推荐.然后做了一段时间图像处理.本科学得比较好的是信号处理相关,信息论.数字信号处理.信号与系统.图像处理等信息科学. 想做什么? 有一个是想做数据分析,然后是想做金融大数据分析. 一直想往金融方向转,但是由于自己一直浑浑噩噩,目标不明确,荒废了一些时日,打算从现在起重新做人,现在大环境较好,比较适合做这个. 学习过什么? 股票信息主要是信号较多.本科是学信号的,对于各种信号处理技术,离散,

数字货币量化分析报告[2018-01-28]

[分析时间]2018-01-28 09:20 [数据来源]OKEX [报告内容]1 BTC短期     5.6短中     3.0中期     0.0 2 LTC短期     4.6短中     6.0中期     3.5 3 ETH短期     3.0短中     1.0中期     1.0 4 ETC短期     4.0短中     3.0中期     3.0 5 BCH短期     2.0短中     4.0中期     2.0 6 XRP短期     4.8短中     4.0中期  

数字货币量化分析报告[2018-01-31]

[分析时间]2018-01-31 09:03 [数据来源]OKEX [报告内容]1 BTC短期    -7.0短中    -5.0中期    -5.0 2 LTC短期    -8.5短中    -5.0中期    -5.0 3 ETH短期    -6.8短中    -5.0中期    -4.0 4 ETC短期    -7.1短中    -5.0中期    -4.0 5 BCH短期    -5.2短中    -4.0中期    -4.0 6 XRP短期    -5.5短中    -5.0中期  

数字货币量化分析报告[2018-02-03]

[分析时间]2018-02-03 09:10 [数据来源]OKEX [报告内容]1 BTC短期     2.9短中     1.0中期    -4.0 2 LTC短期     3.0短中     1.0中期    -4.0 3 ETH短期     6.0短中    -3.0中期    -4.0 4 ETC短期    -2.7短中     1.0中期    -4.0 5 BCH短期    -0.5短中     3.0中期    -4.0 6 XRP短期    -0.3短中     3.0中期  

数字货币量化分析[2018-04-15]

[分析时间]2018-04-15 18:15 [报告内容]1 BTC中期     MA 多头排列中长     MA 多头排列长期     MA 多头排列  长周期金叉 看涨 2 LTC中期    中长     MA 多头排列长期 3 ETH中期     MA 多头排列中长     MA 多头排列长期     MA 多头排列 4 ETC中期     MA 多头排列中长     MA 多头排列长期     MA 多头排列  长周期金叉 看涨 5 BCH中期    中长     MA 多头排列长期 6

量化资料学习《Python与量化投资从基础到实战》+《量化交易之路用Python做股票量化分析》+《组织与管理研究的实证方法第2版》

我们需要利用Python进行数据分析的指南,有大量的关于数据处理分析的应用,重点学习如何高效地利用Python解决投资策略问题,推荐学习<Python与量化投资从基础到实战>等电子资料. 学习<Python与量化投资从基础到实战>电子书,主要讲解如何利用Python进行量化投资,包括对数据的获取.整理.分析挖掘.信号构建.策略构建.回测.策略分析等.<Python与量化投资>利用Python进行数据分析的指南,有大量的关于数据处理分析的应用,并将重点介绍如何高效地利用P

LSTM训练机器理解人类交流的进展

机器学习领域最吸引人的任务之一是训练机器理解人类交流的进展.在机器学习领域,这个分支被称为自然语言处理. 本文试图解释自然语言处理的基本知识以及随着深入学习和神经网络的发展,自然语言处理取得的快速进展. 在我们做进一步研究之前,有必要了解一些基本知识. 什么是语言? 语言基本上是人类社会用来表达和交流思想的固定词汇. 作为他们成长过程的一部分,这些词汇代代相传,大部分保持不变,每年都有少量增加. 像字典这样的好资源被保存下来,这样当一个人遇到一个新单词时,他或她可以通过查阅字典来理解它的意思.一

机器人和人类谈恋爱,这可能吗?

看过关于李世石与人工智能“阿尔法狗”(AlphaGo)围棋事件的人,都见识到了现在人工智能的厉害,但今天我们要谈的“机器人恋爱”这个话题和比赛无关. 相信好多小伙伴和小编一样是个科幻电影控.我们在<我的机器人女友><机器人总动员><绝对男友><宝莱坞机器人之恋>等电影里,看到主人公与机器人恋爱,一个个美好的爱情故事,感人至深.可是,现实中会有这样的事情发生吗? 在开展<机器人和人类谈恋爱,这可能吗?>这个话题之前,小编想先普以及下人工智能的概念: