提升机器学习数学基础,这7本书一定要读-附pdf资源

文章发布于公号【数智物语】 (ID:decision_engine),关注公号不错过每一篇干货。

来源 | KDnuggets

作者 | Ajit Jaokar

转自 | 新智元 编辑 | 大明

【编者按】机器学习和数据科学离不开数学,本文从数学基础的角度入手,推荐了数据科学和机器学习方面的七本参考书以及两本补充读物。相信对打好数学基础的相关人士会有所帮助。

大多数人学习数据科学的人都会把重点放在编程上,实际上编程能力确实是机器学习和数据科学领域的重要技能。但是,要真正精通数据科学和机器学习,必然不能忽视的数据科学背后的数学基础。

出于这个目的,本文介绍了七本在注重打好数据科学的数学基础上的技术读物。当然,涉及到数学,往往阅读体验可能不会很舒服,但要搞好机器学习,数学基础是必须要打牢的,所以努力读书吧!

先说一说为什么在数据科学学习时打好数学基础。

以下是我总结的几个原因:

AI领域无时无刻不在迅速变化。Hinton认为,我们也许应该重新思考反向传播。掌握牢固的数学知识有助于更好地理解AI的演变。一个数学基础深厚的人,对AI的理解和认识与其他仅从表面认识AI的人有很大的区别。此外,掌握数学知识还能更好地了解AI技术带来知识产权的潜力。最后,了解数据科学背后的数学知识,也可以让人更容易获得AI和数据科学的高端职位。

此外,作者推荐这几本书,还有两点个人原因:

1.作者在牛津大学教授物联网数据科学的课程,也包括一些AI技术应用方面的教学事务,在教学过程中涉及到数学基础知识和课程。

2.其次,作者在写一本书来简述人工智能,从数学的角度入手,目标读者是14到18岁的少年。要深入了解数学科学和人工智能数学的数学基础,你需要了解四个方面知识:线性代数,概率论,多元微积分和优化。目前在高中阶段至少会教授这些课程的一部分内容。因此,我试图将高中数学与人工智能和数据科学联系起来,重点是数学建模。

下面进入正题:

01

The Nature Of Statistical Learning Theory 《统计学习理论的本质》

作者:Vladimir Vapnik

PDF资源:

https://statisticalsupportandresearch.files.wordpress.com/2017/05/vladimir-vapnik-the-nature-of-statistical-learning-springer-2010.pdf

如果说要列一份关于数学的书单,这本书是绕不过去的。本书单中排名第一的就是俄罗斯著名数学家Vladimir Vapnik的《统计学习理论的本质》。在这份清单中的所有书籍中,Vapnik这本是最不好找的。Vladimir Vapnik是支持向量机(SVM)的创始人。他的维基百科页面中提供了更多关于他研究成果的介绍。

02

Pattern Classification (2007-12-24)《模式分类》

作者:Richard O Duda

PDF资源:

https://cds.cern.ch/record/683166/files/0471056693_TOC.pdf

就像Vapnik的著作一样,Duda的著作时另一个时代的另一部经典。本书初版于1973年,在二十多年后的2000年才推出第二版,此后一直未再版。时隔近二十年,本书仍然是一个重要资源。本书采用模式识别方法,并涵盖了广泛的算法。

03

Machine Learning: An Algorithmic Perspective,Second Edition (Chapman & Hall/Crc Machine Learning & Pattern Recognition)

《机器学习:算法视角》

PDF资源:

https://doc.lagout.org/science/Artificial%20Intelligence/Machine%20learning/Machine%20Learning_%20An%20Algorithmic%20Perspective%20%282nd%20ed.%29%20%5BMarsland%202014-10-08%5D.pdf

这本书现在已经出版了第二版。此书第一版是我读过的最早的书关于机器学习和算法的著作之一,第二版增加了更多Python代码。与前两本书一样,本书也非常强调算法。

04

The Elements of Statistical Learning: DataMining, Inference, and Prediction, Second Edition

《统计学习基础:数据挖掘、推理和预测》(第二版)

作者:Trevor Hastie,Robert Tibshirani,Jerome Friedman

PDF资源:

https://web.stanford.edu/~hastie/Papers/ESLII.pdf

另一本经典之作,可以作为参考书。

05

Pattern Recognition and Machine Learning (Information Science and Statistics)

《模式识别与机器学习(信息科学与统计)》

作者:Christopher M. Bishop

PDF资源:http://users.isr.ist.utl.pt/~wurmd/Livros/school/Bishop%20-%20Pattern%20Recognition%20And%20Machine%20Learning%20-%20Springer%20%202006.pdf

Christopher M.Bishop的模式识别和机器学习(信息科学和统计学)也是一本深入而精心设计的参考书。

06

Machine Learning: The Art and Science ofAlgorithms that Make Sense of Data

作者:Peter Flach

PDF资源:

http://www.cs.put.poznan.pl/tpawlak/files/ZMIO/W02.pdf

我喜欢Peter Flach的书,尽管亚马逊网站上的一些评论说这书写得太罗嗦,而且代码量显得不足。我特别喜欢这本书中的算法分组(逻辑模型,线性模型,概率模型)章节以及这些主题的整体讲述方式。

最后,是我最推荐的一本书:

07

Deep Learning 《深度学习》

作者:Goodfellow、Bengio、Corville

相关资源:

https://www.deeplearningbook.org/

如果你在找一本值得逐页读完的书,就是它了!这本书既详细,又有现代感,书中内容几乎涵盖了你能想到的关于深度学习的一切知识。

如果无法点开文中资料链接,数智物语已经下载好其中的6份,如有需要可在数智物语公众号对话框回复“机器学习数学”查看详情。

补充两本书:

A First Course in Machine Learning, Second Edition (Machine Learning & Pattern Recognition) by Simon Rogers, Mark Girolami 

作者:Simon Rogers,Mark Girolami

我觉得这本书并不太适合初学者,但它仍然是一本好书(特别是第二版)

Machine Learning: A Probabilistic Perspective

作者:Kevin Murphy 

这本书中评价也很高,但我个人没有读过(因此没有收集)。

写在最后:

除了最后一本《深度学习》之外,我建议其他书不必逐页阅读,而是将其作为参考书,根据需要按相应主题阅读相应的书籍。这些书教会了我时刻保持谦逊。无论我们现在知道了多少,掌握了多少知识,都总能在阅读过程中发现,这个领域原来是如此的庞大和复杂。

这些书已经超越了时间。Vladimir Vapnik现年已经81岁。Duda的著作初版于1973年。我预计50年以后,这个行业里的人们仍然会阅读这些著作。就像与那些经历了时间考验的老朋友们重逢一样。多年之后,也许你会发现,在眼花缭乱的技术、模型和框架背后,数学是永恒的。

原文链接:

https://www.kdnuggets.com/2018/04/7-books-mathematical-foundations-data-science.html

星标我,每天多一点智慧

原文地址:https://www.cnblogs.com/shuzhiwuyu/p/10774060.html

时间: 2024-10-05 04:44:31

提升机器学习数学基础,这7本书一定要读-附pdf资源的相关文章

分享《Python机器学习—预测分析核心算法》高清中文版PDF+高清英文版PDF+源代码

下载:https://pan.baidu.com/s/1sfaOZmuRj14FWNumGQ5ahw 更多资料分享:http://blog.51cto.com/3215120 <Python机器学习-预测分析核心算法>高清中文版PDF+高清英文版PDF+源代码高清中文版,338页,带目录和书签,文字能够复制粘贴.高清英文版,361页,带目录和书签,文字能够复制粘贴.中英文两版对比学习.配套源代码.经典书籍,讲解详细. 其中,高清中文版如图所示: 原文地址:http://blog.51cto.c

《Python机器学习—预测分析核心算法》高清中文版PDF+高清英文版PDF+源代码

资源链接:https://pan.baidu.com/s/1J61jH-fqwGceoId6F8mr5Q<Python机器学习-预测分析核心算法>高清中文版PDF+高清英文版PDF+源代码高清中文版,338页,带目录和书签,文字能够复制粘贴.高清英文版,361页,带目录和书签,文字能够复制粘贴.中英文两版对比学习.配套源代码.经典书籍,讲解详细.其中,高清中文版如图所示: 原文地址:http://blog.51cto.com/14063572/2317037

学习《Python机器学习—预测分析核心算法》高清中文版PDF+高清英文版PDF+源代码

在学习和研究机器学习的时候,面临令人眼花缭乱的算法,机器学习新手往往会不知所措.从算法和Python 语言实现的角度,认识机器学习.专注于两类核心的"算法族",即惩罚线性回归和集成方法,并通过代码实例来展示所讨论的算法的使用原则.详细讨论预测模型的两类核心算法.预测模型的构建.惩罚线性回归和集成方法的具体应用和实现. 参考: <Python机器学习-预测分析核心算法>高清中文版PDF+高清英文版PDF+源代码 高清中文版,338页,带目录和书签,文字能够复制粘贴. 高清英文

机器学习数学基础- gradient descent算法(上)

为什么要了解点数学基础 学习大数据分布式计算时多少会涉及到机器学习的算法,所以理解一些机器学习基础,有助于理解大数据分布式计算系统(例如spark)的设计.机器学习中一个常见的就是gradient descent算法,是线性回归问题的一个基础算法.gradient是数学概念. Gradient 假设一个函数有n个自变量:f(x1,x2......xn),且每个x都是标量值,那么该函数的gradient就是一个n维的向量函数,每个component是f函数针对xi的partial derivati

机器学习数学基础总结

目录 线性代数 一.基本知识 二.向量操作 三.矩阵运算 概率论与随机过程 一.概率与分布 1.1 条件概率与独立事件 1.2 联合概率分布 二.期望 三.方差 3.1 方差 3.2 协方差与相关系数 3.3 协方差矩阵 四.大数定律及中心极限定理 4.1 切比雪夫不等式 4.2 大数定理 4.3 中心极限定理 五.不确定性来源 六.常见概率分布 6.1 均匀分布 6.2 二项分布 6.3 高斯分布 6.4 指数分布 6.5 拉普拉斯分布 6.6 狄拉克分布 6.7 多项式分布与狄里克雷分布 6

【机器学习数学基础】线性代数基础

目录 线性代数 一.基本知识 二.向量操作 三.矩阵运算 线性代数 一.基本知识 本书中所有的向量都是列向量的形式: \[\mathbf{\vec x}=(x_1,x_2,\cdots,x_n)^T=\begin{bmatrix}x_1\\x_2\\ \vdots \\x_n\end{bmatrix}\] 本书中所有的矩 \(\mathbf X\in \mathbb R^{m\times n}\) 都表示为: \[\mathbf X = \begin{bmatrix} x_{1,1}&x_{1,

机器学习数学基础

数据挖掘中所需的概率论与数理统计知识 (关键词:微积分.概率分布.期望.方差.协方差.数理统计简史.大数定律.中心极限定理.正态分布) 导言:本文从微积分相关概念,梳理到概率论与数理统计中的相关知识,但本文之压轴戏在本文第4节(彻底颠覆以前读书时大学课本灌输给你的观念,一探正态分布之神秘芳踪,知晓其前后发明历史由来),相信,每一个学过概率论与数理统计的朋友都有必要了解数理统计学简史,因为,只有了解各个定理.公式的发明历史,演进历程.相关联系,才能更好的理解你眼前所见到的知识,才能更好的运用之.

机器学习数学基础- gradient descent算法(下)

Gradient Descent算法 续上文. gradient descent的用途: 可以用于求解一个函数f(x1,x2,......xn)的local 最小值. 关于local最小值: 一个函数可能有多个local最小值,所谓local最小值是当给定(x1,x2,......xn)的某一个实例,如果在该实例的无限小的附近的任何一个实例的f值都大于该实例的f值,那么该实例所对应的就是f的一个local最小值. gradient descent算法求解local最小值的方法如下: 任意给定(x

机器学习数学基础知识备忘

1.特征值分解 2.奇异值分解 奇异值的物理意义是什么? 奇异值分解(SVD)原理详解及推导 奇异值分解(SVD)原理与在降维中的应用 奇异值分解 SVD 的数学解释 3. 原文地址:https://www.cnblogs.com/yhlx125/p/9488276.html