【机器学习快速入门】简单自学机器学习理论

机器学习理论——part I 前言（第II部分内容点此；第III部分内容点此）

动机

大多数人在小的时候被魔术师以及魔术技巧所迷住，并想弄明白其中的奥秘。有些人会带着这份迷恋研究到更深处并学习魔术技巧，有些人会接受专业的训练，而其他人会继续平庸下去。我在年幼时也尝试过魔术技巧并沉迷于其中，然而后来学习的是另外一种魔术，称作计算机编程。

编程确实酷似魔法，和魔术一样，自学的现象在计算机编程世界占了上风。在过去的两年计算机开发者调查显示，超过一半的开发者是无师自通。我是在全职工作外学习这些计算机科学知识，当你已经工作后再尝试学习这些科目会是相当大的一个挑战。

如今我们可以找到很多关于计算机科学的视频、文章、博客以及自定进度点播MOOC课程，这几乎涉及每个方面。其中很多写的很详细并解释得很清楚，而且可以自由访问。这些资源的存在使得自我学习过程更加全面，使工作/生活/学习的平衡更易于管理，不幸的是，这并不是学习编程的完全正确趋势。

机器学习

虽然在大二就开始自学机器学习，但当毕业后才意识到自己错过了许多基础知识。所以在同样情形下，我很高兴发现自己避免了这种情况的发生，但机器学习理论不像计算机科学世界那么容易驯服。虽然互联网上充满了学习资源，但理论方面的内容是不一样的。即使你可以找到书籍、讲义、甚至是全部的讲座，但大多数不能像一系列博客、短视频或者MOOC提供的灵活性。

本文根据作者本身学习计算机科学的经验，给出了学习机器学习理论的这一系列文章，能够填补自主学习机器学习的理论与实践之间的差距，从而在征途上少一些艰辛。

这个系列是为了谁？

该系列意图是为了给机器学习理论方面提供简单的介绍，这将会对你是有利的，如果你是：

l 机器学习的从业者，并想深入了解详细过程；

l 机器学习的学生，尝试深入钻研机器学习理论并会喜欢一些宽松政策；

如果你是机器学习的初学者，这可能不是你的最佳起点。使用实际教程开始会更好。当你掌握了机器学习实践的窍门后，如果你觉得有必要，可以回到这里。

先决条件

理论需要数学知识，机器学习的理论也不例外。但是由于这仅仅是为了简单的介绍，不会钻研太深的数学分析，将更加注重理论的直觉与足够的数学知识以为了保持严谨。

大多数所需要的知识是：概率和随机变量，和微积分的基本知识。

注意事项

我仍然不是这个领域的专家，所以当你在这个系列中发现一些错误，请让我知道；

这仅仅是一个简单介绍，如果你想真正理解该领域，在阅读该系列的同时也要努力工作；

现在将机器学习问题快速公式化，以便建立起数学模型和框架

形式化学习问题

在这个系列中，将主要侧重有监督学习问题，数据集，其中xi是特征向量，yi是标签，问题是给定xi，怎么得到yi的值。比如说xi是具体医学测量结果的特征向量，yi是病人是否为糖尿病，我们希望从给定的医学测试结果中诊断是否患有糖尿病。

为了建立理论框架，重新梳理下已经知道的内容

1 知道从众多人口中随机采样的数据集中的值（xi,yi），具体的例子中的数据集是从众多可能患者中随机采样得到

将该例子公式化，两个随机变量X和Y表示xi与yi，且概率分布分别为P(X)和P(Y)；

2 我们知道X与Y之间有一些规则，并希望任意的XY对都能符合该规则，定义该规则，正式将其称为空间，X是从输入空间X中取值得到，Y是从输出空间Y取值得到；

3 特征值与标签之间有一定的联系，在某种程度上，特征值决定标签值，或者说Y的值是以X值为条件；

正式地，将其称作条件概率P（Y|X），利用该概率可以得到其联合概率密度P(X|Y)；

全文点击：http://click.aliyun.com/m/12651/

时间： 2024-10-06 00:45:05

【机器学习快速入门】简单自学机器学习理论

【机器学习快速入门】简单自学机器学习理论

【机器学习快速入门】简单自学机器学习理论的相关文章

Jmeter 快速入门--简单的http压测

机器学习如何入门

Maven入门指南：Maven 快速入门及简单使用

Maven入门指南 Maven 快速入门及简单使用

Maven 快速入门及简单使用

Maven 系列一：Maven 快速入门及简单使用【转】

Maven 系列一： Maven 快速入门及简单使用

RPC学习----Thrift快速入门和Java简单示例

C#基础与实例教程最简单的C#快速入门教程【转自：http://www.82011433.com/Html/?6982.html】