初八从家里滚回学校,也算有段时间了。这段时间里作出了一些改变,也对生活有了许多新的想法。
首先是,学习并不应该有什么强迫。上个学期自己的想法都一团糟,也仍是逼自己有空了就滚去看书,结果效率自然也高不了哪里去。读计算机一年多了,听到的段子自然也不会少,总感觉里面调侃的生活不太对,包括各种加班加点。自己的观念是,无论工作还是学习,都应该只是生活的一部分。从整个生活的角度去让自己的效率变高,才是真的该做的。
我也不清楚正确的生活该是怎样的,自己能做的就是时常从整个生活的角度去反思,去回看自己哪些地方是不该有的。比如说,大一时候见到我哥的生活就是,晚上回家做事各种拖,冲凉前还得先看看dota比赛什么的,直到深夜才进行休息,也时常抱怨累。我对自己说的是,以后得时常反思生活才行。
现在自己的作息是,早上七点三左右自然醒,洗漱完就做些基本的运动;中午睡40分钟午觉(耳塞真是睡眠神器啊);傍晚吃完饭心情好就溜达圈;晚上12点关灯睡觉。周六傍晚环校跑一趟,周日下午尽量出校外逛。其他时间,不用上课不用赶任务基本都待在图书馆。活动这些,多半推掉好了。顿时感觉,啊,既不心塞又能保证学习效率,挺不错的呢。不知道一段时间后面对四个科目的大作业是否还能如此淡定呢,如果呢,或许这作息还能用到工作之后。
至于对外界认识的思考,在这段时间看了《醉汉的脚步》、《思考,快与慢》,以及自学抽象代数和旁听了”数理逻辑”、”西方哲学导读”这些课后,有了不少感悟。直接说结论吧。以下都是我的理解。
命题p到命题q的推论中,我们常常依靠的是相关性而不是因果关系。若是因果关系,则其推理过程应该是严格的证明过程,但我们很少有作这样的证明。相比之下,我们更倾向于”找规律”这样一个方式去得到这样的推论,即归纳推理。这就像是依靠神经网络算法去训练得出一个莫名其妙却能拟合测试数据的公式一样。
这样的推理会有什么情况呢?我们对这样的推论,只能得出一个假说。这个假说只能被各种”事实”去证实(这个了解概率论的发展史就好懂了),让这个推论成功的概率无限接近1而不能等于1。可以参考”休谟问题”。而一旦有一个反例举出,则其推论不能成立。
所以科学的”可证伪性”可以这么理解:目前理论的成功都只是暂时的成功,一旦出现反例则会面临巨大危机以至于不得不提出各种修正。而哲学的意义并不是瞎想,而是用于验证科学的这种”正确性”到底该如何理解,比如某些理论得有什么前提等。
但我个人的想法有点不同。其实是相近于HMM。当然其实我没做过相关的工作,只是从书上了解这一模型,并对它有着书上并无提及的特殊的理解。即,即使有反例提出来证明这个推论不正确,那并非我们全错,而是我们尚且缺乏了解它成功所需的前提。继续的,假设我们接触到的数据即为所有的话,那我们可以将其视为,这个推论成功的概率,而继续将它应用下去。当然科学不能胡来,这个是得直接修正才行,只是我们做计算机的并不需要这样。我对HMM模型里面,能够忽略前一因素的前面因素的组合的原因是,这个想法已经是将它们之间组合出现的概率统一的归为,前一因素产生印象的前提条件。哎自己还是真是讲得不太清,不过我也不知道专门讲这个的,还好吧。
但新的数据总会对旧的概率模型里训练得出的参数产生影响的,我们需要修正。但具体修正的方法呢?贝叶斯方法。”西方哲学导读”课上推荐的书目为,Scientific Reasoning—The Bayesian Approach. 我还没看,不过,思维是共同的,这个没太多好怀疑的。
然后是命题的证明。这里主要是想讲下逻辑课里面想到的一些东西。公理是公认必然成立的,定理是由它们推理出来的。这个高中数学课本都有讲。那定义呢?我一直以为,定义是像公理一样的存在,你不承认它就没法好好玩下去了。
但现在我觉得我错了。定义表现的只是一个假设,由这个假设配合一些公理,你能得出许多结论。但是,这样的假设是否本身就该成立呢?并不是的。它们也并非都是有意义的。那么这个假设是否成立,它成立的话能带来哪些影响,这就是逻辑学里面的内容了。我一开始没意识到这点,所以在看古德曼的那个奇怪的”蓝绿”的定义时,始终想不懂。下课后滚上讲台回翻PPT重看,才想通里面的猫腻。
这个情况能说明什么呢?其中一个对应情况就是,如果我们在机器学习的过程中,用了监督训练的方法,我们是否能带着足够的理由去怀疑,这个监督本身就是有问题的呢?我们在日常生活里,经常给各种各样的东西下定义,是否有误呢?这些定义影响到我们的生活里了,那我们反思的时候,是否要反思这些,去从认识的根本上改变我们的想法呢?
如果你也看过《话/镜》,或许你能知道我在说什么。我从别的地方看到那本书的介绍时,真的被吓了一大跳——居然还有这样的影响。是的,定义其实无处不在,它就包含在我们的语言里,而语言里面的逻辑就这么的从最基础的地方开始影响了我们对万物的认识。
对于我来说(至少目前而言),数学的0、1这些最基本的定义,只是为了证明逻辑学里面的关系而存在的。即,数学其实是逻辑学的形式证明。
好的,继续讲。就个人来说,我并不觉得神经网络那个简单的训练参数是真正意义上的机器学习。我的观念很可能不太同被讲烂的那个概念。我所疑惑的问题是:
我们该如何突破自身的认识,去从根本上获知这个世界,就像群论给方程求解带来的革命一样?
从古德曼悖论的一个具体例子出发,对于数列i: 1, 2, 3, 4, 5… 它的规律可能是k,也可能是(k-1) (k-2) (k-3) (k-4) (k-5) + k . 那我们该如何从众多相互竞争的假说中,根据数据,得出某个假说为真的概率呢?
Q-D问题:当一个假说H和它的辅助假说A受到某个证据的否定时,这种否证的效应如何在H和A之间分配。比如说,自己的想法其实是能由许多假说综合推出来的,那如果发现自己错误了,该如何反思自己呢?
还有许多这样的问题。是的,我想探讨的是,假如我们用数据的方式来量化人类对世界的认识及其认识过程,那会怎样?我们可以对自身作出的反思,对想法进行修改,那机器呢?这些,我觉得才是真正的机器学习,也是我在这一领域真正想做的事情。
但在折腾计算机之前,恐怕我得先想想自身吧。我自身在学东西的时候,发现了一个奇怪的现象:我对抽象代数里的严格证明的推理过程并不敏感,而在学习过程中对各概念的理解却算得上挺快的,看的时候自己总能想到模型去解释它。或许就是这”天赋”使得我在学数据结构时,自己一旦看懂了就再也不用担心代码实现的问题,而自己明明没怎么写过代码。
可是,自己总得克服这一障碍啊。推理不同证明,能从大体上直接分出那几种方法。那推理有哪些基本准则,它们之间如何相互结合得出一些复杂而有趣的推理过程呢?这样从更基层的角度去思考,或许能给自己带来无尽的益处。然而现实是自己还没能专心思考,就得被叫去折腾后台了。老实说,自从上了”数理逻辑”课和自己看了抽象代数,其中一个感想是:我们因为考试,忽略了最根本的逻辑了,而几千年前欧几里得的《几何原本》,真的是被我们轻视得太多了。
啊,毕竟是思前想后,最终在两三个小时里面写出来的文。算是对自己最近的思考的一个综合的整理,然而并没有太注重表述。这个就请谅解了。