【机器学习基础】机器学习基石课程学习引入

机器学习是什么

“机器学习”是人工智能的核心研究领域之一，其最初的研究动机是为了让计算机系统具有人的学习能力以便实现人工智能。

事实上，由于“经验”在计算机系统中主要是以数据的形式存在的，因此机器学习需要设法对数据进行分析，这就使得它逐渐成为智能数据分析技术的创新源之一。

机器学习是构建复杂系统的一种方法，也许依靠我们的脑力把处理一个问题的所有规则写成程序可能不容易做到，那么我们就让机器自己去根据数据和资料进行学习，自己去处理问题。

机器学习和数据挖掘的关系

数据挖掘可被认为是识别出巨量数据中有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程。其实顾名思义，数据挖掘就是试图从海量数据中找出有用的知识。大体上看，数据挖掘可以视为机器学习和数据库的交叉，它主要利用机器学习界提供的技术来分析海量数据，利用数据库界提供的技术来管理海量数据。

用一句话来概括，机器学习是人工智能的一个方向，机器学习是数据挖掘的一种实现方式。

机器学习和统计的关系

统计是利用数据来对一个未知的过程进行推测的活动，是实现机器学习的一种方法。

传统统计学更加关注数学方面的推论，而不像机器学习技术关注计算机如何计算出来推论的结果。

机器学习的应用场景

当我们不可能通过手动编程实现的系统，即不可能穷尽所有规则的情况下

当我们无法轻松定义答案的情况下

当需要进行快速决定的情况，这种情况人类无法做到，比如股票市场的超高频率交易

当针对很广泛的用户个性化服务，比如针对消费者的营销策略

机器学习的关键

(Pattern)存在某种潜在的模式或规则可以被学习到

(Definition)无法轻松通过编程实现

(Data)具有关于某种模式的数据资料

机器学习的实际定义

机器学习实际定义

由上图所示，由于我们不知道f，我们于是把手上的资料D，通过机器学习的算法A，得到一个推荐使用的函数g，我们希望g和理想的目标函数f越接近越好。

我们可以把很多可能的公式放到一个“假说”的集合H（即包含了各种可能的g），机器学习算法所要做的事情是要从H中选择一个它觉得最好的假说，即g。

这里，我们给出一个机器学习更加清楚的定义：机器学习就是，我们从数据出发，通过机器学习算法，算出一个假说g，希望g能够很接近我们更渴望的理想模型f。

接下来

接下来，我会根据在线学习的课程陆续整理日常学习的机器学习算法，并结合实际问题，多做实验，力求得到更好的学习效果，我一定会坚定信念，更加努力，追赶优秀的步伐。

转载请注明作者Jason Ding及其出处

Github主页(http://jasonding1354.github.io/)

CSDN博客(http://blog.csdn.net/jasonding1354)

简书主页(http://www.jianshu.com/users/2bd9b48f6ea8/latest_articles)

时间： 2024-11-01 16:21:00

【机器学习基础】机器学习基石课程学习引入的相关文章

python机器学习基础机器学习实战

python机器学习基础,以Python语言介绍.主要内容包括:机器学习的基本概念及其应用:实践中最常用的机器学习算法以及这些算法的优缺点:在机器学习中待处理数据的呈现方式的重要性,以及应重点关注数据的哪些方面:模型评估和调参的高级方法,交叉验证和网格搜索:管道的概念:如何应用到文本数据上,文本特有的处理方法. 机器学习实战,切入日常工作任务,摒弃学术化语言,利用高效的可复用Python代码来阐释如何处理统计数据,进行数据分析及可视化.通过实例从中学会机器学习的核心算法,并能将其运用于一些策略性

机器学习基础——机器学习概述

一. 什么是机器学习机器学习是从人工智能中产生的一个重要学科分支,是实现智能化的关键. 机器学习是一门多领域的交叉学科,设计概率论,统计学,逼近论,凸分析,算法复杂度理论等多门学科,专门研究计算机怎样模拟或实现人类的学习行为,以获取新知识或技能,重新组织已有的知识结构使之不断改善自身的性能. ——百度百科二. 发展历程三. 机器学习方法 1. 有监督学习有监督学习分为分类和回归. 分类形象地说就像是做考试的选择题,在训练集中满足这个条件的一堆,满足那个条件的一堆.....,最后根据你给出

【机器学习实战】第1章机器学习基础

第1章机器学习基础机器学习概述机器学习就是把无序的数据转换成有用的信息. 获取海量的数据从海量数据中获取有用的信息我们会利用计算机来彰显数据背后的真实含义,这才是机器学习的意义. 机器学习场景例如:识别动物猫模式识别(官方标准):人们通过大量的经验,得到结论,从而判断它就是猫. 机器学习(数据学习):人们通过阅读进行学习,观察它会叫.小眼睛.两只耳朵.四条腿.一条尾巴,得到结论,从而判断它就是猫. 深度学习(深入数据):人们通过深入了解它,发现它会'喵喵'的叫.与同类的猫科动物

机器学习实战之第一章机器学习基础

【机器学习基础】理解为什么机器可以学习1——PAC学习模型

引言自从下定决心认真学习机器学习理论开始,接触到很多基本问题,但其实都不是很理解,比如损失函数.风险函数.经验结构最小化.结构风险最小化.学习方法的泛化能力.VC维等,这些概念在学习中都纯属空泛的概念存在,我都不理解这些概念存在的意义. 为什么会存在这样的问题呢?我自己想了一下,有几个原因:首先,很多相关的书籍在讲授这些概念的时候,很少说这些为什么会有这样的概念问题,为解决什么问题引入的这些概念:然后,还有一些书,在简单表述了这些概念之后就立马挨个介绍算法了,遇到这样的书也会忽视这些基础问题的

【机器学习基础】理解为什么机器可以学习2——Hoeffding不等式

引入在上一小节"理解为什么机器可以学习--PAC学习模型"中,我们主要讨论了假设的错误率问题和如何说一个学习器是可学习的,并给出了PAC学习理论.这一小节,我们将沿着这个方向,讨论一下,有限假设空间的样本复杂度,并用Hoeffding不等式来界定概率边界. 假设空间的样本复杂度 PAC可学习性很大程度上由所需的训练样本数量决定.随着问题规模的增长所带来的所需训练样本的增长称为学习问题的样本复杂度(sample complexity).在多数实际问题中,最限制学习器成功的因素是有限的可

【机器学习基础】理解为什么机器可以学习3——VC理论

引入上一小节中,"理解为什么机器可以学习--Hoeffding不等式"中,我们介绍了有限假设空间中的概率边界.在这篇文章中,我们将推广至无限假设空间中,进而引入VC理论. 面临待解决的问题上一节,我们证明了PAC学习的样本复杂度随假设空间对数增长,但是以假设空间的个数|H|来刻画样本复制度存在缺点: 对于|H|很大的情形,会使一个很弱的边界,即出现错误的概率很大对于无限假设空间的情形无法应用所以,我们要考虑H的复杂度的另一种度量方式,称为H的Vapnik-Chervonenki

台湾大学林轩田教授机器学习基石课程理解及python实现----PLA

最近在班主任的带领下,开始观看台湾大学林轩田教授的机器学习基石课程,虽然吧,台湾人,汉语说得蛮6,但是还是听着怪怪的,不过内容非常值得刚刚入门的机器学习小白学习,话不多说,直接进入正题. 1.基本介绍(貌似这里一般是应该背景介绍,但是,历史吗,自己去百度吧) (1)preceptron 翻译中文叫做感知器,如果你之前听说过神经网络的,它其实就是网络中的一个神经元,它自身的作用非常小,只能对于数据只能实现二分类,然而如果连成网络的话,神经网络的每一层都可以作为一个线性函数或非线性函数,将函数复

台大机器学习基石课程之机器学习基本原理和概念

前段时间在网上看到了coursera公开课台大机器学习基石课程,比较全面而且清晰地将机器学习所需的基本知识.理论基础给与了讲解.foundation中有几个比较重要的概念和思想,先进行一下回顾,然后开启对后续技法课程的学习和总结. 1. VC dimension(VC维,非常重要的概念) 能够shutter 二分类问题的上限.也是衡量模型复杂度的工具(类似自由度的概念).之所以这个概念比较重要是它能够解释为什么机器能够学习. 1),以概率统计中常用的手段:用sample来估计整体,机器学习也是如