首先声明,本人才疏学浅,对智能的理解只能算是一个后辈的学生,在诸多大神面前妄谈“智能”这么高深的问题,实在有些捉襟见肘的感觉。
开宗明义:智能是什么?很多人会说是“运用知识解决问题的能力”,当然也有人说得更简单如:“智能的本质是预测”,“智能的表现在于超强的适应性”等等。我这里无法去否定他们的观点,因为否定他们没有任何意义,因为智能本身就是一个很宽泛的概念,这些观点只是对智能理解的角度不同罢了;但从任何一个观点,如果用“打破沙锅问到底”的精神去思考,也许最后能得到同样的结论。我现在就“打破一个砂锅”试试。
这里仅仅从“运用知识解决问题”的角度入手,这句话是说:智能是为了解决“问题”的,解决问题的时候要使用“知识”。那么“问题”是什么,“知识”是什么,“知识”又是怎样“运用”来解决问题的呢(啰嗦吧)?我这里从“问题”的角度入手,问题是人提出来的,是因为人的某种需要,需要解决,那么如果问题没有解决是不是就没有智能了?一个小朋友,回答不出老师的问题,我们说他没有智能,这个人如果换成爱因斯坦呢?从另外一个角度,按照常识我们解决一个复杂问题需要多个步骤,A人解决A问题需要多个步骤,B解决B问题也需要多个步骤,A没解决,B解决了,A没智能,B有智能;但A解决问题的步骤里面恰恰包含了B的所有步骤。由此看来把“智能”和“解决问题”直接等效起来是有问题的。智能不一定能解决问题,或者要看问题是什么。这里需要先把解决问题从智能本质分开,后面再解释解决问题是什么。
“知识”是什么,不同的人不同的理解,因为“知识”这个词本身只是一个符号,是一个抽象概念,不同的人在脑中对它的表达不可能完全一样,即使对它的解释看起来完全一样,人和人的理解也是有差别的。我这里生搬硬套的引入一个“信息”的概念(我的对“信息”这个词理解可能和你不一样),并把“知识”定义为“信息的投影”。“信息”又是一个很泛的概念,我们不妨把它进一步的泛化:实体空间的一切事物,小到原子、夸克,大到地球、太阳系、星系、星系团、平行宇宙……,描述它们当前和各项属性,过去、未来的各项属性,以及它们之间的相互作用以及可能的相互作用的属性叫做信息,此外还有信息本身的信息,信息的信息的信息,这个信息与那个信息结合的信息等概念也叫做信息;现在比较新的物理理论,质量是通过几种夸克之间相互作用产生的,描述它们的只有信息,即我们生活的这个实体世界本身也不存在所谓的实体,我们看到的、摸到的、仪器测到的都是信息。这里扯太远了,目前还是先保留这个实体空间,因为它对我讨论后面的问题有帮助。既然信息无所不包,这里也引入一个概念叫“信息空间”(有人用过了),它也是一个抽象的概念,不存在体积的问题,每个维度量的大小都好像实数一样多;它维度数的大小也像实数一样多。虽然信息空间很大,但它里面的信息还是有规律可循的,包括信息的信息也是有规律的,这个规律本身也是信息(在数学上叫范畴,范畴的范畴)。知识就是这样一个信息空间的某一部分在实体空间的物质上的“投影”,这里使用“投影”这个概念,是出于习惯或形象,首先投影确实反映了信息的某些特性,存在信息的损失,但同样一个投影它可能反映的是另一种信息的另一个方面,就好象DNA,同样的片段在不同的环境可以合成出不同的蛋白质;更极端的——看似不相关的事物,实际上它们内部可能存在着某种联系。这也是信息表现出来的规律之一,在信息论里面有描述。
讨论到这里,基本可以把“智能”定义为“信息的获取和运用”或者更准确一点,把“智能活动”定义为“信息的获取和运用的过程”。获取的过程就是信息的“投影”或者“再投影”的过程,伴随着信息的损失;运用的过程实际就是实体之间直接或间接的相互作用(实体本身就是带自身信息的);而实际上信息获取的过程也是这种作用的结果;区别只是信息流向的不同……如果就这么定义的话,那么一面镜子,接收光子信息并通过内部作用反射光子的信息,不是也有了智能?……镜子做的是信息传递,但在镜子的角度就是“获取”和“运用”啊,所以智能不能这么定义,那么除了信息传递这个过程,信息空间还有啥呢?答案是:信息的抽象。所以“智能活动”要定义为:“获取信息并抽象,以及对抽象信息运用的过程”,或者说智能的本质在于“信息的抽象”。
至于怎样抽象,这又是一个很大的问题,又涉及到物质和物质,信息和信息相互作用,相互关系的问题,可以以后再讨论。
为了更形象一点,下面本人就人类智能是怎样演的做一下简单描述,描述得很粗浅,但是那个意思就行了。很幸运,人类自从他能被叫做人的那一天起就是群居的,而且能识别物体了,这是剑齿虎,那是长毛象,手里的是棍子,其实进入我们眼睛的,不过是一些光子,是我们的视网膜,大脑的视觉皮层把这些光子的信息进行加工——信息抽象的过程,加工的网络很大一部分来自我们的遗传——最后在我们的脑中能够找到见过的动物的脑细胞,然后前辈就发出危险或者进攻的叫声,渐渐的这些叫声发展出了语言,语言是对叫声的抽象,有了语言人就能更好地交流打猎或逃跑经验了;有时候,前辈不在,要告诉他事情,只好那棍子在地上画画,画画代表了对事物的抽象,慢慢地画画抽象成了文字,能够范围更大更持久的传递打猎或逃跑经验了。人类学会了耕种、取火、制作武器等技能,建立了文明,又抽象出文学、数学、物理、化学等一推各种各样的学科,正是人类抽象出的这些知识,才创造了今天的社会,科学知识只是人类知识的很小的部分,它是自然规律信息的投影。而今天,人类创造抽象和使用抽象信息的能力也越来越高。
用“对信息抽象的能力”来定义智能的本质,使我们对智能理解一下宽泛了很多:
1、自然界在很早就有了智能,智能不是人类的专利,人类和其他动物不同的只是掌握的知识抽象程度不同罢了。在自然界智能有很多种表现形式,都表现为信息抽象的程度越来越高、规模越来越大。生命的进化本身就可以说是一种智能,DNA(或其他遗传物质)所表达的信息越来越复杂以致创造出人,知道基因组计划的人,无不为大自然的“鬼斧神工”所折服,此为遗传的智能;蚁群、蜂群、鱼群等都表现出群智能特征,其本质是一种信息共享;最新的研究,很多动物其实都比我们想象的要聪明得多;人类社会是集之前这所有智能的大成者,语言、文字时信息共享持久快捷,现在又多了互联网、机器智能,更是如虎添翼……,由此看来智能其实是自然界很普遍的一种现象,只要条件合适,它就会生根、发芽、成长,宇宙中其他地方有很多智能体一点都不该觉得奇怪了。
2、智能的程度在一定意义上是可以衡量的,即抽象信息的广度,深度,处理时间长度不同;也即我们所说的低级智能和高级智能。那是否深度越深、广度越大、速度越快就越智能呢,至少在一定程度是这样,也有例外:
①信息在实体空间的投影,以及投影的投影,具有传递性:即A投影到B,B投影到C也就是A的一种投影。
②知识本身是信息的投影,如果两种信息在实体空间投影相似,那么如果条件恰当是可以重复利用的。
当然还有很多,这在很大程度上取决于“算法”。
3、智能活动本身和解决问题不直接相关。这一点在之前的论述里面已经有过一些讨论,问题是人提出来的,它出于某种需要,问题的解决是要在信息空间利用当前信息和已有的知识,寻找某种路径,达到人认为满意的结果。但大多数问题是无解的,要么信息不够,要么资源不够,要么提问的方式有问题……。人没事的时候瞎想(像本人现在这样),做梦什么的也是智能活动的一种,而且还比较高级。
4、智能活动的实体和有没生命无关。根据定义,只要能获取信息并加以抽象就是智能活动,与实体是否具有生命无关;机器实现的智能也是智能,现在已经到了大数据时代,计算机处理信息的规模都前所未有的高,某种程度远超人类本身,为什么人老说它不智能呢?个人认为主要原因在“人类中心主义”,另一方面计算机对数据处理的抽象度确实不够,还有就是机器确实不能“理解”它处理的数据是什么,这涉及到人类所谓“理解”模型的建立以及计算机如何把它表达出来的问题。
5、智能不是万能的,它的发展也是没有止境的。
①根据测不准原理,宇宙的大多数事物是无法准确模拟的,还需要实践来观察、发现,导致新的知识的发现具有很大的偶然性;
②信息的产生,特别是深层信息的产生是有很大偶然性的,这需要自然界的巧合以及某一时期某个人的顿悟,当然从另一个角度,知识的积累特别是信息本身知识的积累,也会对信息的产生和发现会有极大的促进作用,表现为这种偶然越来越频繁,智能发展越来越快。
③不是所有问题都有答案或者都可以解决:大多数问题本身就具有不可计算性,我们收集信息的能力,处理信息的知识,处理信息的量,输出的方式都是有限的(即便机器也是如此)。
④人类发展至今,所积累的知识虽然已经非常浩大,但相对于信息空间而言,也是微不足道的,即使在将来机器智能高度发展的一段很长的时间甚至是整个人类历史、机器历史都是没有止境的。
下面再“妄谈”一下个人对当前与智能相关的热点问题和技术的看法:
1、意识
意识是一种脑机制,是动物进化到较高程度时的产物,大自然的杰作。我们目前无法知道它是什么,但我们知道我们经常无意识的做某些事情,无意识的动作可以发生在我们用意识控制之前,裂脑人两边大脑分开后,两边各有一个意识……。
我们不好区分到底哪个脑区是负责意识的,但我们不妨设想这样一种脑机制:大脑本身是由神经网络控制的,它控制着我们身体的各个器官,管理着几大系统,当然有些是由小脑控制的,这些都在我们的意识之外,另外还有一种机制——至少和短时记忆,注意力及时间感知等有关——这种机制在大脑原有的神经网络系统遇到特殊情况,发出较强信号的时候或者在集中注意力在某些器官(但信号没那么强)的时候进入短时记忆,在短时记忆里对信息用另外一种和无意识系统不大相同的方式处理。处理完也可以发出信号,驱动身体动作,如果重复多次同样的过程,无意识也创建了相应的神经连接,以后类似情况无意识就自己处理了。
这里面有一个争论的问题,就是有没有一个意识的中心的问题,短时记忆、敏感化作用比较原始的动物就有,至于中心在哪儿或者没有中心,也许可以从“哪种能效更高”的角度考虑。要想在自然界生存,就得节能。
在我们意识的情况下,常常伴随着语言的现象,就好像我们在用语言思考一样,个人认为原因很多,可能性最大的是因为语言本身的编码比较短,在短时记忆存储量有限的情况下能够存储更多的信息(或者叫信息的索引),增大了意识对信息处理的量,能效更高。有兴趣的可以去研究一下聋哑人朋友的认知,应该也有类似倾向。左右脑可能都有同样功能的脑机制,通过胼胝体和额叶连在一起时是竞争关系。
总之,意识是脑区功能高度分化下的产物,仅用传统神经连接的方式也许也能实现同样的智能,但需要更多能量,耗费更多材料(多耗材本质也是浪费能量),所以自然选择了意识这种较节能的方式,而人类语言的产生对此种机制进行了极大的扩充,文字的产生就可以把短时记忆的信息写下来,更使短时记忆的有效性扩充了数倍。
2、情感和欲望
很多人认为:情感和欲望对智能很重要,甚至把它们作为智能的标志。我基本同意这一观点,但要加一个字,“人的智能的标志”。人的智能是智能的一种表现形式,或者说它是多种智能表现形式的综合体。激素和某些化学物质以及人类先天的神经网络、器官等很大程度决定了人类的行为。它们是人类很多智能活动的动因,影响着人类智能活动的方向,改变着人脑的结构……。较新的研究表明,知识能够改变大脑结构,毒品也能……人真是太复杂了。不过,目前计算机已经可以对情感进行一定程度的模拟,当然无法完全一样,因为人和人还不一样呢。
3、深度学习
在这里我就不过多介绍深度学习,网上的大牛太多,我这里只说说我对它产生的意义的理解:
①深度学习模拟人脑的功能,是认知与记忆的统一体,认知的过程伴随着回忆和记忆,回忆或想象的过程进行着新的认知。
小议:如果再加上网络之间的交织,对学习功能有极大促进作用,例如“发现相同就进行类比”——发现相同是一个层次,类比是另外一个层次的逻辑——这本身就是可以学习的。
从这个角度讲,也许都不用设计另外的逻辑层,单靠神经网络就足够了;当然,如果有逻辑层处理更高效,还是需要引入的,毕竟计算机在算算术等活动方面还是非常高效的,这需要保证接口与神经网络适配。
②它提供了一种新的信息处理手段,实现了自动特征提取,并在此基础上实现了很高效的分类识别。
③它目前还没有完备的数学理论支持,把计算机科学很大程度上变成了实验科学,对我们开拓思想有极大的促进作用。
④在视觉、语音领域,它的特征提取结果得到了脑科学研究者的印证,也就是在大脑中找到了表达同样特征的脑区,使我们向大脑学习,找到了事实依据。
⑤自动编码和自动特征提取,为我们对高维度信息,或者抽象信息的特征提取以及表达提供了有效的手段。
⑥自动编码中的解码过程即信息还原的过程,是由抽象到具体的过程,这与人类的想象力在某种程度上是等效的。这个方向发展下去:将来你给机器一个剧本,它能给你一部电影,演员由你指定。
当然也不能把深度学习理解成万能的,它只是人工神经网络的一种,智能还有其他表现形式,各自有擅长的处理信息的方式。
4、NARS
Non-Axiomatic Reasoning System(非公理推理系统),很高兴这个理论及系统是一位华人——王培老师提出来的,在这里我也不多做介绍,谈谈认识:
①它是一种认知逻辑,用一个简单理论——假设在任何条件下,知识和资源相对问题都是不充分的——解决了以往很多数理逻辑在实际应用中存在的不相容的问题。
②它是一种较完备的形式语言,是一个开放系统,可以用来表示现实世界,可推演、可计算。
③公式简单,容易学习,可操作性好,且有一套较完善的系统实现。
④开拓思路,引入了频率和可信度两个概念就解决了不相容问题,也许可以再引入几个维度,解决其他的问题。
⑤它不排斥外来输入,任何数字化的信息、一幅图像、一段声音在里面都可以作为操作单元,可以很好的与外部系统相结合。
另外,还有一个AIXI模型,它证明从数学角度上讲智能是不可计算的(又有一个AIXItl可以最近似计算),那里面的智能指的是预测。就本文观点,预测只是智能产生动因中的一种;不管怎么说,信息的规律就在那里,等着我们去发现。