人工智能离我们有多远/近?
柯洁在跟AlphaGo下完棋之后讲过一句话:“人类围棋几千年的发展,我们只看到了冰山一角,而AlphaGo则有了上帝的视角”。
有人说人工智能近在眼前,明天就会颠覆人类,特别像李开复这种牛人,天天出来吓唬别人,说五年之后人工智能会使大量人失业,把人吓到不行。还有人说人工智能都是骗人的,过几天就没了,都是噱头。到底人工智能离我们远还是近呢?我们来客观的看一下。
首先要搞清楚人工智能是分两个层次的。一个是感知层,一个是认知层。
什么是感知能力?简单理解就像一个人的器官的感觉,譬如说能感觉到是冷还是热,能感觉图像上画的是猫还是狗。能感觉到别人说话的内容,有人说英语时,就能反应说这是英语,自己不懂英语,就明白自己肯定是听不懂他说话的。一听就知道他说的是英语,这就叫感知能力。什么叫认知能力?就是指一些更加偏向于推理跟智能方面的东西。譬如说一个人讲的是英语,虽然自己不懂英语,但从他说话的动作、神态以及当前所处的环境能够分析出来,他可能是需要帮什么忙,大概能猜出来他想做什么,这就是一种认知能力。还有譬如说读了一篇文章后,能根据自己的认知和理解,推断出来这篇文章讲得有没有道理。像朱老师给大家讲了一堂课之后,学生就会觉得“这个老师讲得有道理”或者说“这个老师讲的狗屁不通”。为什么会产生这样一种判断呢?就是因为有一定的认知能力。譬如说找一个五岁孩子听老师说的话,他知道老师说的是一个什么字,但他听不懂老师表达的是什么意思,有没有道理。因为他只有感知能力,没有认知能力。譬如说找一个相关行业的大学生听朱老师的课,那他一听就知道讲的是什么内容,有没有道理。所以说感知跟认知是两个层次的东西。
在人工智能领域,感知的运用主要就是在于图像识别,语音识别。语音识别就是别人说了一段话,机器只要能把他翻译成文字,能把他提取出来,这就是拥有了感知能力。说白了就是机器的耳朵没坏,别人说的都听进去了。但听进去了并不代表听懂了,只拥有感知能力的机器并不知道那段话的言下之意,因为那是靠认知能力决定的。在图像识别方面,如果说能识别到一个图像里面是一只狗或者说是一只猫,但并不知道图片代表什么意思,这就是感知能力。但如果能看出人家为什么要给你看这张图片,能看出来图片代表了什么意思就是认知能力。认知能力说的就是自然语言的一个理解。自然语言的理解跟语音识别有什么关系呢?譬如说感知能力是识别语音说了什么内容,但自然语言的理解就是指理解到了语音所代表的含义。感知能力只能识别出一个字,但自然语言的理解可以知道里面的情绪。譬如说:“滚”字,自然语言就能理解到这个人很愤怒,这个人骂我了。我要么走,要么骂回去,或者打一架,会产生一种相应的反应,这就是自然语言的理解。语音识别就只能识别出来一个字,是很平和的,是没有任何情绪的,所以说这是两个层次。人机交互,就像网上看到的仿真机器人,能跟人说话,聊天,这就是真正的人机交互了。
目前感知层已经开发得不错了,譬如说语音识别方面,说话的内容已经能够很容易的翻译出来,但是认知层还远远不行,还差得远。人工智能能识别语音的内容,但识别不出所代表的含义,所以真正的类人机器人还是很遥远的。很多人一听说人工机器人出来,就想着哪天可以娶个机器人媳妇,就完美了,但那还是很遥远滴。至少这几年还是看不到的,现在人类还是只是在突破感知方面的技术,尽量让机器先把字跟图认对,如果拿人做类比的话,现在的AI还在人类的两三岁的状态。想让他跟你谈文学方面的造诣什么的,还早着呢。他现在只能练个ABC什么,只能给你讲讲笑话,如果你跟他说谈论下文学,讨论下C语言这种高深的,那他就听不懂。他不懂这些东西,这就是目前人工智能发展的一个档次。
人工智能最终的目标是什么呢?当然不是为了玩,最终的目标是让机器做到人做不到的东西,让机器从上帝视角出发去帮人解决问题。举几个目前研究领域在发力的地方,譬如说用图像分析的方法,让拥有图像分析能力的AI通过口型识别给电影进行配音。什么意思呢?像一些口型专家可以通过口型来判断一个人在说什么,就不听声音,光看图像,看嘴怎么动就知道在说什么。这种技术呢,在很多特工电影里面经常看到,其实现实生活中也是有这种人的。但是有这种能力的人是非常稀有的,而且他们的识别准确率也不是特别的高。但用AI去分析,他的识别率就非常高了,会比人厉害,识别的准确率跟速度都比人类高很多;还有医疗AI,让AI帮人看病,做诊断。让AI成为比医生更厉害的医生,当然限于西医,中医目前还做不到;AI甚至能帮助人类进行作曲,写作类的文艺创作。比如说作曲,周杰伦之前为什么这么火呢?就是因为周杰伦作曲好,再加上方文山帮他作词,这两人一组合,每年都能推出好多新歌,好歌。其实把周杰伦的歌给谁唱都能火,因为主要是歌写得好(杰伦粉不要打我们)。周杰伦怎么赚到那么多钱?那不就是靠他的作曲能力嘛。如果有一个AI,听了大量周杰伦的歌,学习了大量他的歌,就可以发现里面的规律了,于是乎,AI写了一首歌,那首歌是一首没听过的新歌,但一听就是周杰伦的风格。机器能不能做到这种事情呢?现在就是在尝试让AI做这些事情。比如说让机器去学习很多莎士比亚的小说,让机器把莎士比亚的所有小说学习完再自己写一个新的,然后给你看,别人说这是莎士比亚写的,你觉得可能是真的。但其实不是,是机器仿造莎士比亚的风格去写的。如果让朱老师去画画,打死我也画不出来呀,我就没那个艺术细胞。呵呵,让我作曲就更不可能了,让我听曲都听不懂,别说作曲了。我们一般认为这些事情只有那些有艺术细胞的人才能做,但如果机器也能做,也能有艺术细胞了,是不是就做到了人做不到的事情了呢?这个太厉害了,机器能不能哪一天会编程,然后让程序员全部下岗呢?可以的,有了AI后,程序员下岗是有可能的。柯洁在跟AlphaGo下完棋之后讲过一句话:“人类围棋几千年的发展,我们只看到了冰山一角,而AlphaGo则有了上帝的视角”。什么是“上帝视角”?就说他站在人类目前还不能够站到的角度看问题。就像上面提到的,给你一张照片,如果上面是一个外星生物,人类可能就会觉得:“什么鬼玩意,不认识”。而AI会说:“是一只猫”,结果一问外星人,真的是只猫。他是怎么判断的呢?我们不知道,他是依靠他的技术去分析的,他就是有这样一种人类目前没有的视角。柯洁为什么有这样的一个感叹呢?他已经是最优秀的围棋手了,但他也是一个人类,他为什么说人类看到的只是冰山一角呢?因为他以前的对手不管怎么下都逃不过他的思路,他都能知道对方想做什么,但当他跟AlphaGo下棋的时候,他不知道对方是怎么想的,看不懂对方的棋路、风格和想法,所以柯洁说只是看到了冰山一角。像围棋还有很多的玩法跟思路,我们人是没注意到的,但AI通过学习掌握到了。所以机器是有超越人的一种能力的,就叫做“上帝视角”。AI开启了上帝视角后,就可以作弊了,他可以搞出一些人类无法理解的东西。有一句话可以帮助大家了解什么是“上帝视角”,这句话是微软研究院的人员说的,他说:“人类其实认知一个东西也是经历了一个阶段的,人类一开始的认知是纯属观察的,没有任何科学研究的理论,只是通过眼睛去看,去观察这个社会”,譬如说中国古代讲的天圆地方,人们认为“天是圆的,地是方的”,西方人认为“地球是宇宙的中心”,这些都是观察得来的。当时只会观察,没有其他方法。后来牛顿用数学方法研究实践,又确认了一个理念叫“科学”,什么叫科学?科学就是能用数学解释的东西,数学能解释就是科学,数学不能解释的东西就是迷信,像鬼呀,神呀都是迷信,因为不能用数学的方法来证明是存在的。到了上个世纪五六十年代,人们开始用计算方法模拟世界,计算机发明了。以前为什么不这么做呢?因为以前算不过来。当计算机发明后,就可以用计算模拟世界,譬如说天气预报,当年诸葛亮是怎么借东风的呢,怀疑他也是算出来的,他可能就是算到了会刮风,那他是怎么算出来的呢?难道有人给他报天气预报吗?他可能是通过观察的方法。像清明时节雨纷纷也是观察出来的,因为一到清明节就老下雨。现在人们是怎么知道的呢,就是通过计算的方法来计算天气会怎么变化。但是到人工智能时代之后会有一个第四种方式,就是用数据来驱动。所谓的用数据驱动,就是把大量的数据喂养AI,当“喂饱”了之后,他就会拥有上帝视角,他就能用人类所不能理解的方式告诉你答案,结果证明他是对的,但不知道他是怎么得出来的。只需要用数据喂养它,他就可以长出超越人类的智慧,这就叫人工智能。人工智能离我们还有多远呢?有些东西近在咫尺,有些东西远在天边。
原文地址:http://blog.51cto.com/astonzhu/2061884