机器学习该怎么入门?

在说该怎么入门之前,咱们应该了解一下什么是机器学习。机器学习也叫数据挖掘、模式识别,其定义很多。

简单地说,机器学习要做的就是,现在有些数据(比如你人人网好友和他们的发言),我们要对数据进行处理,希望从数据中得到我们想要的信息(比如这些好友哪些和你投缘)。由此我们可以看出机器学习其实是对人类智能的模仿,也是实现人类和更高智能的必经之路。

机器学习这个概念认为,对于待解问题,你无需编写任何专门的程序代码,泛型算法(generic algorithms)能够在数据集上为你得出有趣的答案。对于泛型算法,不用编码,而是将数据输入,它将在数据之上建立起它自己的逻辑。

举个例子,有一类算法称为分类算法,它可以将数据划分为不同的组别。一个用来识别手写数字的分类算法,不用修改一行代码,就可以用来将电子邮件分为垃圾邮件和普通邮件。算法没变,但是输入的训练数据变了,因此它得出了不同的分类逻辑。

好了,说了这么多,该开始讲重点了:机器学习到底该怎么入门?

第一,找个项目或者找一门稍微具体点的关于机器学习的书。开始深入研究。机器学习应用只是一方面,要想明白透彻,还得整明白这一个个模型背后的故事。

第二,去Coursera上Andrew Ng的《机器学习》,完成所有作业,最好能全部拿满分。这是相当入门的课程。

课程深入浅出,而且作业也非常适合入门者,都是设计好的程序框架,有作业指南,根据作业指南填写该完成的部分就行。这门课上完了,你基本上可以开始简单地应用各种机器学习技术了。

第三,修炼内功。话说自己发现光应用不行,还得整明白其背后的东东后,就想四处找人请教,到哪儿去学高级的内功呢?看看这份清单(微博上发现的):

听说这是机器学习教父级别的人物Jordan推荐的书籍,而且全部都是值得珍藏的!这些资料大多都可以在百度里搜到。如果搜索不到大家也可以去新浪微博找那些搞机器学习的人寻求帮助,他们会很热心的。

说完入门学习,如果你还想进行深入学习机器学习,看看应该怎么做:

当前机器学习的最大问题是它主要活跃于学术界和商业研究组织中。对于圈外想要有个大体了解而不是想成为专家的人们,简单易懂的学习资料不多。但是这一情况每一天都在改善。

你可以下载安装SciKit-Learn,用它来试验成千上万的机器学习算法。它是一个python框架,对于所有的标准算法都有“黑盒”版本。

看看机器学习概要图 by Yaser Abu-Mostafa (Caltech)


差不多就是这样了。最后说几句心里话,不管你学习哪一门新科目,都不是一帆风顺的。还有,重要的是你的决心,你到底要不要学这门学科!你要是抱着半吊子的心态,那你可以不用看了,因为半吊子的决心学不明白任何一门学科!你要是想学,就咬紧牙,坚持看,反复看,反复查以及多动手。

时间: 2024-10-10 00:25:17

机器学习该怎么入门?的相关文章

机器学习:从入门到沉迷

机器学习:从入门到沉迷 最简单的机器学习介绍 你是不是也经常听人说起机器学习但是完全不能明白到底什么才是机器学习,是不是完全厌倦了与同事点头一样的交谈,让我们通过这篇文章改变这一现状吧 这是一篇针对想知道什么是机器学习但是不知道如何入门的人的入门.我猜有很多人厌倦了通过图阅读维基百科的文章来了解机器学习,想有一篇通俗的文章来介绍什么才是机器学习,那么这篇文章就是这样的 什么是机器学习 当你要通过很多数据去发现某个问题的时候,你不用去针对特定的问题编写代码而是通过使用很多通用算法来获得获得你所需要

机器学习:从入门到沉迷之机器的思考方式

一般情况下我们人类大脑可以在没有明确指示的情况下处理绝大部分问题.例如,你做房产经纪时间很长,你对于房产的合适定价.它的最佳营销方式以及哪些客户会感兴趣等等都会有一种本能般的“感觉”.强人工智能(Strong AI)研究的目标就是要让计算机能这样思考. 但是目前的机器学习算法还没有那么好——它们只能专注于非常特定的.有限的问题.也许在这种情况下,“机器学习”更贴切的定义是“在少量范例数据的基础上找出一个等式来解决特定的问题”. 不幸的是,“机器在少量范例数据的基础上找出一个等式来解决特定的问题”

机器学习的最佳入门学习资源

Programming Libraries 编程库资源 我是一个“学习要敢于冒险和尝试”观念的倡导者.这是我学习编程的方式,我相信很多人也是这样学习程序设计的.先了解你的能力极限,然后去拓展你的能力.如果你了解如何编程,可以将编程经验很快借鉴到深入学习机器学习上.在你实现一个实际的产品系统之前,你必须遵循一些规则.学习相关数学知识. 找到一个库并且仔细阅读相关文档,根据教程,开始尝试实现一些东西.下面列出的是开源的机器学习库中最好的几种.我认为,并不是他们中的每一种都适合用在你的系统中,但是他们

史上最强----机器学习经典总结---入门必读----心血总结-----回味无穷

让我们从机器学习谈起 导读:在本篇文章中,将对机器学习做个概要的介绍.本文的目的是能让即便完全不了解机器学习的人也能了解机器学习,并且上手相关的实践.当然,本文也面对一般读者,不会对阅读有相关的前提要求. 在进入正题前,我想读者心中可能会有一个疑惑:机器学习有什么重要性,以至于要阅读完这篇非常长的文章呢? 我并不直接回答这个问题前.相反,我想请大家看两张图,下图是图一: 图1 机器学习界的执牛耳者与互联网界的大鳄的联姻 这幅图上上的三人是当今机器学习界的执牛耳者.中间的是Geoffrey Hin

开源机器学习工具scikit-learn入门

Scikit-Learn是基于python的机器学习模块,基于BSD开源许可证.这个项目最早由DavidCournapeau 在2007 年发起的,目前也是由社区自愿者进行维护. Scikit-Learn的官方网站是http://scikit-learn.org/stable/,在上面可以找到相关的Scikit-Learn的资源,模块下载,文档,例程等等. Scikit-Learn的安装需要numpy,scipy,matplotlib等模块,windows用户可以到 http://www.lfd

机器学习:从入门到晋级

摘要: 什么是机器学习,为什么学习机器学习,如何学习机器学习,这篇文章都告诉给你. 目前,人工智能(AI)非常热门,许多人都想一窥究竟.如果你对人工智能有所了解,但对机器学习(Machine Learning)的理解有很多的困惑,那么看完本文后你将会对此有进一步深入理解.在这里,不会详细介绍机器学习算法的基本原理,而是通过将比较有意思的视频(YouTube)和文字相结合,逐渐增加对机器学习基础的理解. 当看到本文时,请坐下来放松一下.因为下面的这些视频需要花费一点时间,但看完视频后,你肯定会被吸

[阿里云-机器学习PAI快速入门与业务实战 ]课时1-机器学习背景知识以及业务架构介绍

什么是机器学习? 机器学习指的是机器通过统计学算法,对大量的历史数据进行学习从而生成经验模型,利用经验模型指导业务. 目前机器学习主要在一下一些方面发挥作用: 营销类场景:商品推荐.用户群体画像.广告精准投放 金融类场景:贷款发放预测.金融风险控制.股票走势预测.黄金价格预测 SNS关系挖掘:微博粉丝领袖分析.社交关系链分析 文本类场景:新闻分类.关键词提起.文章摘要.文本内容分析 非结构化数据处理场景:图片分类.图片文本内容提取OCR 其它各类预测场景:降雨预测.足球比赛结果预测 当然,机器学

机器学习:概述入门篇

本周任务: 1.python基础的准备 本课程拟采用Python做为机器算法应用的实现语言,所以请确保: 1)安装好Python开发环境, PyCharm 或 Anaconda等都可以,按个人习惯喜好. 2)基本库的安装,如numpy.pandas.scipy.matplotlib 3)具备一定的Python编程技能,如果不熟悉,可选择一个教程进行学习,Python简单好上手,资源也很丰富. 菜鸟教程 Python 3 教程 http://www.runoob.com/python3/pytho

机器学习 Matplotlib库入门

2017-07-21 15:22:05 Matplotlib库是一个优秀的python的数据可视化的第三方类库,其中的pyplot支持了类似matlab的图像输出操作.matplotlib.pyplot是绘制各类可视化图形的命令子库,相当于快捷方式. import matplotlib.pyplot as plt #plt是一个别名 一.matplotlib.pyplot子库 plt.plot(x, y, format_string, **kwargs) x  : X轴数据,列表或数组,可选 y