机器学习入门:机器学习概论

什么是机器学习?

在1959年,Arthur Samuel:不用编程去指定机器做什么,而是让机器有能力自己学习;

在1998年,Tom Mitchell:首先定义任务T,经验E,表现P,如果机器有一个任务T,随着经验E的增多,表现P也会变好,则表示机器正在经验E中学习;

以上就是对机器学习的两个定义;

机器学习在生活中也处处可见,比如:

(1)在gmail中,提供了一个“垃圾邮件”选项,可以通过机器学习辨别邮件是否为垃圾邮件,此处利用了分类算法;

如果我们根据Tom Mitchell的定义,则:

T:classify email as spam or not spam.

E:watching you label emails as spam or not spam.

P:The number of emails correctly classified as spam or not spam.

(2)ebay利用学习型算法判断某个信用卡是否被盗;

(3)“深蓝”下棋胜过国际象棋大师,是因为“深蓝”已经通过机器学习的方法学习了下棋的技术;

以上这些例子就是机器学习的常见案例;

机器学习的常见算法分为:

(1)Supervised Learning(监督学习):下面的图片就是典型的监督学习的例子,监督学习分为Classifying和Regression,两者的区别后面解释,下图的文字明确地解释了监督学习的定义:

监督学习的例子:垃圾邮件的分类,这个在上面已经讲解过;

(2)Unsupervised Learning(非监督学习):给定一组数据,这些数据从外表上来看没有什么差别,都落在了坐标轴上,我们的目标是从中找出结构,并将其分组,如下图,是聚类的例子,每个数据都是以原点的形式出现的,但是我们能够很清晰地将这些点分成两组(group into):

非监督学习的例子:

  • google News中,会将一些新闻进行聚类(分组),即每个大类的新闻下面都会有多个URL,这些URL虽然来自不同的网站,但是都是这一类新闻,比如:

  • Market segmentation:将客户分组为几组,对每组客户进行不同的销售手段,如下图:

  • 两个人在话筒前面同时说话,录音后发现这两个人的声音会混杂在一起,但是如果通过非监督学习,则可以将这两个人的声音分离开来;

以上介绍了机器学习的常见分类(监督学习和非监督学习),并详细介绍了定义及应用;

刚才我们说到监督学习分为:

(1)分类;

(2)回归;

这两者有什么区别呢?

区别在于分类的output为离散的,而回归的output为连续的,这样讲可能比较抽象,比如上面的例子就是回归,因为output为price,虽然看起来price是离散的,但是他的值是可以无限制的,因此是连续的,而下图为分类的例子,因为output=恶性or良性,可能的取值就两个值,因此为回归;

以上说明了分类和回归的区别;

练习题

1.你现在在证券所上班,对于某个特定的股票A,希望根据以往的价格走势,来推算出明天的价格是多少,这算是分类问题还是回归问题?

答:属于回归问题,因为股票的价格是连续的,因此是回归问题;

2.我们给出4个问题:

  • 我们已经知道了这一堆是垃圾邮件,想要将这些垃圾邮件继续分子类;
  • 给定一个数据集,全是心脏病的病人,我们需要将他们分成不同的簇,对每个簇用不同的治疗方法;
  • 两个足球队要比赛,根据以往的数据,预测哪个队会赢;
  • 根据一个人的DNA,预测10年后得糖尿病的几率;

哪些是监督学习,哪些是非监督学习?

答:(1)和(2)是监督学习,(3)和(4)是非监督学习;

原文链接:http://blog.csdn.net/xiazdong/article/details/7949981

时间: 2024-10-14 00:36:12

机器学习入门:机器学习概论的相关文章

机器学习入门资源--汇总

机器学习入门资源--汇总 基本概念 机器学习 机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论.统计学.逼近论.凸分析.算法复杂度理论等多门学科.机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法.机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法.因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论.算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法. 下面从微观到宏观试着梳理一下机器学习的范畴:

简单粗暴地入门机器学习

有很多小伙伴问过我零基础要怎么入门机器学习或者人工智能,今天来提炼一下,方便志同道合的朋友们参考. 记得我刚入此山洞准备修炼的时候,就 Google 了好多这类的问题,那时候觉得大家的建议好多呀,这条路看起来真长,那么多东西要学,那么多书要看,那么多有用的课程要学. 现在我可以就自己走过的坑坑包包来推荐一条简单粗暴的路径. [step 1: 方向] 在行动之前,先想好这几个最基本的问题,如果自己想不全都可以去搜一下,知乎上很多大拿的回答: --1.为什么要学习机器学习或者人工智能呢? 我的话,很

机器学习入门:线性回归及梯度下降

机器学习入门:线性回归及梯度下降 本文会讲到: (1)线性回归的定义 (2)单变量线性回归 (3)cost function:评价线性回归是否拟合训练集的方法 (4)梯度下降:解决线性回归的方法之一 (5)feature scaling:加快梯度下降执行速度的方法 (6)多变量线性回归   Linear Regression 注意一句话:多变量线性回归之前必须要Feature Scaling! 方法:线性回归属于监督学习,因此方法和监督学习应该是一样的,先给定一个训练集,根据这个训练集学习出一个

从零单排入门机器学习:Octave/matlab的常用知识之矩阵和向量

Octave/matlab的常用知识之矩阵和向量 之前一段时间在coursera看了Andrew ng的机器学习的课程,感觉还不错,算是入门了.这次打算以该课程的作业为主线,对机器学习基本知识做一下总结.小弟才学疏浅,如有错误,敬请指导. Andrew的课程选了Octave/matlab为编程语言.他选择这个估计更多是考虑大众性,这门语言容易入门. 然后我觉得学会使用Octave/matlab还是挺有用的.一来是她天生是个数学工具,开始的研究阶段使用她最方便莫属,注意我这里所说的是研究阶段,商用

从零单排入门机器学习:OctaveMatlab的常用知识之画图

OctaveMatlab的常用知识之画图 之前一段时间在coursera看了Andrew ng的机器学习的课程,感觉还不错,算是入门了.这次打算以该课程的作业为主线,对机器学习基本知识做一下总结.小弟才学疏浅,如有错误,敬请指导. 看几个例子即可. 'ro'的含义,r表示红色,o表示o形. 可以记住某些常用的选项. 一条命令画两条线.其实可以多条. 一般来说,用户在新输入plot 命令之后,原图片上的内容将被删除.如果你想保存当前的图片内容并将新创建的图片层叠到原图片上,你可以通过使用hold

机器学习入门——单变量线性回归

线性回归的概念,在高中数学书里就出现过. 给你一些样本点,如何找出一条直线,使得最逼近这些样本点. 给出一个例子:假设 x 是房子面积,y是房子价格,确定一条直线需要theta0和theta1. 给出x,我们就可以计算出房子的价格 h(x) = theta0+theta1*x 关键是如何计算出theta0和theta1,也就是如何找出这么一条直线呢? 在这里,引入一个概念,叫做cost function.m表示样本个数,也就是训练样本数目 这是一个square error,学过统计的应该经常见到

机器学习--入门答疑

刚接触机器学习这一个月我都做了什么? 这一个月,从对机器学习充满好奇与畏惧,到对各种算法稍有理解以及围绕推荐场景的编码实践,算是对机器学习有了一个入门的体验.但是中间也踩过不少坑,比如啃过线性代数的教材.看过无聊的机器学习课程.追过高端的机器学习书籍.陷入一个算法无法自拔(最后也没整明白)...其实,学习机器学习没有那么难,也很容易走偏.谨以此文,作为ML入门小白的一个小小的参考... 本篇虽不是这一个月的流水账,但是基本按照下面的思路对着一个月做了一次总结: 什么是机器学习? 机器学习都有什么

【转载】机器学习入门者学习指南(经验分享)

机器学习入门者学习指南(经验分享) 2013-09-21 14:47 本人计算机研二,专业方向自然语言处理,个人对于机器学习挺感兴趣,于是开始学习.所以,原来这家伙是个菜鸟……正是由于自己是个菜鸟,所以体会到自学机器学习的艰辛,于是在这里分享一下个人的经验,希望能对入门者有所帮助.一些有关机器学习的介绍在这里就不做详细介绍了,感兴趣的同学可以去维基百科.就直接进入正题.1.去Coursera上Andrew Ng的<机器学习>,完成所有作业,最好能全部拿满分.这是相当入门的课程,老师是机器学习领

一步一步入门机器学习之五:机器学习自学指南

事实上有许多的途径可以了解机器学习,也有许多的资源例如书籍.公开课等可为所用,一些相关的比赛和工具也是你了解这个领域的好帮手.本文我将围绕这个话题,给出一些总结性的认识,并为你由程序员到机器学习高手的蜕变旅程中提供一些学习指引. 机器学习的四个层次 根据能力可以将学习过程分成四个阶段.这也是一个有助于我们将所有学习资源进行分类的好方法. 初学阶段 新手阶段 中级阶段 高级阶段 我之所以把初学阶段和新手阶段区分开来,是因为我想让那些完全初学者(对这个领域感兴趣的程序员)在初学阶段对机器学习有一个大

机器学习入门 - 1. 介绍与决策树(decision tree)

机器学习(Machine Learning) 介绍与决策树(Decision Tree) 机器学习入门系列 是 个人学习过程中的一些记录与心得.其主要以要点形式呈现,简洁明了. 1.什么是机器学习? 一个比较概括的理解是: 根据现有的数据,预测未来 2.核心思想 : Generalization 可以理解为,归纳.概括.就像是人的学习一样,找出一件事物与与一件事物的联系 3.归纳性的机器学习(Inductive machine learning) 其核心思想是使用训练数据,并从其中摸索出一套适用