李航(节选):统计加计算的核心是计算未来各种可能性的大
小。假设我们把骰子投掷到桌上,如果我们能够准
确测量出骰子的初始速度和角度、空气的阻力、桌
面的弹力与摩擦力,基于物理原理和数学分析方
法,我们就能精确地计算出骰子落到桌面时哪个面
朝上。如果我们只关心点数为 1 的那一面朝上的可
能性,那么这种计算就没必要,因为按照概率统计
原理,其可能性是 1/6。概率统计的特点就是忽略
过程和细节,而只关注结果。客观世界是极其复杂
的,通过解析的方法很难计算出结果,而概率统计
可以帮助我们计算出各种结果出现的可能性(当然
在很多情况下,计算各种可能性也需要非常复杂的
计算)。这一功能使统计加计算变得非常实用,这
就是它作为预测未来工具的强大之所在。
人的判断不完全是客观和理性的,会受到情感、
经验、兴趣、习惯等主观因素的影响,也会受到信
息的不完全与不准确的制约,而且人的计算与存储
能力远远不及计算机。统计加计算会帮助人做出合
理的判断,并提供强大的工具.
机器学习技术可以由概率、系统、算法三个维
度来描述(见图 6)。概率是统计的基础,系统和算
法是计算的基础。迄今为止,统计机器学习已有大
量的算法,比如决策树、提升方法、核方法、神经
网络、贝叶斯方法、图模型、非参数化方法、稀疏
方法,诸多的系统(比如 Hadoop、Spark)被开发
出来,并应用在各个领域。
未来机器学习能够帮你做越来越多的事情,如预测择偶、找工作、未来
发展和生病感冒等等,是因为在信息世界里每个人的大量信息都被记录下来了,使
得预测机器有强大的统计加计算的预测能力。
读后感:机器学习方法是基于现象-结果数据,基于一定的观察数据对结果做预测的,并没有涉及到现象背后的根本原因。不同于由因到果的分析方法,采用分析的方法,利用基本原理和逻辑推理,便可预测从未发生过的事情。而采用机器学习的方法,若要预测某一件事情,则这件事情必定已经发生了很多次,但促使这件事情发生的背后原因由于因果关系过于复杂或条件限制等无法获知,所以只能根据一些已经发生的现象去预测未来。所以,对机器学习而言,预测采用的特征信息非常重要。一件事情发生时,此时此刻世界的现象有千万多,到底哪些因素才是真正与它相关的呢,这就是特征选择问题。选择的特征太多,则需要更多的现象-结果数据去调节机器学习算法参数。选择的预测特征太少,则容易丢失一些可能的重要特征。特征选择,需要人凭借经验进行一定的人工干预,即选择与预测事件有必然联系的现象特征(具体怎么与预测事件联系的,数学函数是什么,无法知道,只知道会影响结果。)机器学习算法越来越强大,预测越准确,越细致,则需要越大量的数据去调节算法的参数。同时,事情本身应该具备统计稳定性,即,一些现象发生了,则该事件也必然会发生。数学上,只有特定特征空间的现象数据,才能导致事件的发生,基于规则的简单机器学习算法就是一个证明,如通过机器学习算法找喜欢的女朋友、是否应该给某人贷款、图像识别(经典例子,现象-结果统计稳定性很高,只是难于寻找两者的本质原因。)。