转:机器学习资料书籍

链接:http://suanfazu.com/t/topic/15

入门书单

  1. 《数学之美》 PDF586
    作者吴军大家都很熟悉。以极为通俗的语言讲述了数学在机器学习和自然语言处理等领域的应用。
  2. 《Programming Collective Intelligence》(《集体智慧编程》)PDF343

    者Toby Segaran也是《BeautifulData : The Stories Behind Elegant Data
    Solutions》(《数据之美:解密优雅数据解决方案背后的故事》)的作者。这本书最大的优势就是里面没有理论推导和复杂的数学公式,是很不错的入门
    书。目前中文版已经脱销,对于有志于这个领域的人来说,英文的pdf是个不错的选择,因为后面有很多经典书的翻译都较差,只能看英文版,不如从这个入手。
    还有,这本书适合于快速看完,因为据评论,看完一些经典的带有数学推导的书后会发现这本书什么都没讲,只是举了很多例子而已。
  3. 《Algorithms of the Intelligent Web》(《智能web算法》)PDF138

    者Haralambos Marmanis、Dmitry
    Babenko。这本书中的公式比《集体智慧编程》要略多一点,里面的例子多是互联网上的应用,看名字就知道。不足的地方在于里面的配套代码是
    BeanShell而不是python或其他。总起来说,这本书还是适合初学者,与上一本一样需要快速读完,如果读完上一本的话,这一本可以不必细看代
    码,了解算法主要思想就行了。
  4. 《统计学习方法》 PDF 模糊281 epub178

    者李航,是国内机器学习领域的几个大家之一,曾在MSRA任高级研究员,现在华为诺亚方舟实验室。书中写了十个算法,每个算法的介绍都很干脆,直接上公
    式,是彻头彻尾的“干货书”。每章末尾的参考文献也方便了想深入理解算法的童鞋直接查到经典论文;本书可以与上面两本书互为辅助阅读。
  5. 《Machine Learning》(《机器学习》) PDF520

    者Tom
    Mitchell是CMU的大师,有机器学习和半监督学习的网络课程视频。这本书是领域内翻译的较好的书籍,讲述的算法也比《统计学习方法》的范围要大很
    多。据评论这本书主要在于启发,讲述公式为什么成立而不是推导;不足的地方在于出版年限较早,时效性不如PRML。但有些基础的经典还是不会过时的,所以
    这本书现在几乎是机器学习的必读书目。
  6. 《Mining of Massive Datasets》(《大数据》) PDF172

    者Anand Rajaraman[3]、Jeffrey David
    Ullman,Anand是Stanford的PhD。这本书介绍了很多算法,也介绍了这些算法在数据规模比较大的时候的变形。但是限于篇幅,每种算法都
    没有展开讲的感觉,如果想深入了解需要查其他的资料,不过这样的话对算法进行了解也足够了。还有一点不足的地方就是本书原文和翻译都有许多错误,勘误表比
    较长,读者要用心了。
  7. 《Data Mining: Practical Machine Learning Tools and Techniques》(《数据挖掘:实用机器学习技术》) PDF153

    者Ian H. Witten 、Eibe
    Frank是weka的作者、新西兰怀卡托大学教授。他们的《ManagingGigabytes》[4]也是信息检索方面的经典书籍。这本书最大的特点
    是对weka的使用进行了介绍,但是其理论部分太单薄,作为入门书籍还可,但是,经典的入门书籍如《集体智慧编程》、《智能web算法》已经很经典,学习
    的话不宜读太多的入门书籍,建议只看一些上述两本书没讲到的算法。
  8. 《机器学习及其应用》
    周志华、杨强主编。来源于“机器学习及其应用研讨会”的文集。该研讨会由复旦大学智能信息处理实验室发起,目
    前已举办了十届,国内的大牛如李航、项亮、王海峰、刘铁岩、余凯等都曾在该会议上做过讲座。这本书讲了很多机器学习前沿的具体的应用,需要有基础的才能看
    懂。如果想了解机器学习研究趋势的可以浏览一下这本书。关注领域内的学术会议是发现研究趋势的方法嘛。
  9. 《Managing Gigabytes》(深入搜索引擎)PDF110
    信息检索不错的书。
  10. 《Modern Information Retrieval》 PDF49
    Ricardo Baeza-Yates et al.
    1999。貌似第一本完整讲述IR的书。可惜IR这些年进展迅猛,这本书略有些过时了。翻翻做参考还是不错的。另外,Ricardo同学现在是Yahoo
    Research for Europe and Latin Ameria的头头。
  11. 《推荐系统实践》 PDF164
    项亮,不错的入门读物

深入

  1. 《Pattern Classification》(《模式分类》第二版) PDF118
    作者Richard O. Duda[5]、Peter E. Hart、David。模式识别的奠基之作,但对最近呈主导地位的较好的方法SVM、Boosting方法没有介绍,被评“挂一漏万之嫌”。
  2. 《Pattern Recognition And Machine Learning》 PDF100

    者Christopher M.
    Bishop[6];简称PRML,侧重于概率模型,是贝叶斯方法的扛鼎之作,据评“具有强烈的工程气息,可以配合stanford 大学 Andrew
    Ng 教授的 Machine Learning 视频教程一起来学,效果翻倍。”
  3. 《The Elements of Statistical Learning : Data Mining, Inference, andPrediction》,(《统计学习基础:数据挖掘、推理与预测》第二版) PDF115

    者RobertTibshirani、Trevor Hastie、Jerome
    Friedman。“这本书的作者是Boosting方法最活跃的几个研究人员,发明的Gradient
    Boosting提出了理解Boosting方法的新角度,极大扩展了Boosting方法的应用范围。这本书对当前最为流行的方法有比较全面深入的介
    绍,对工程人员参考价值也许要更大一点。另一方面,它不仅总结了已经成熟了的一些技术,而且对尚在发展中的一些议题也有简明扼要的论述。让读者充分体会到
    机器学习是一个仍然非常活跃的研究领域,应该会让学术研究人员也有常读常新的感受。”[7]
  4. 《Data Mining:Concepts andTechniques》(《数据挖掘:概念与技术》第三版) PDF65

    者(美)Jiawei Han[8]、(加)Micheline Kamber、(加)Jian
    Pei,其中第一作者是华裔。本书毫无疑问是数据挖掘方面的的经典之作,不过翻译版总是被喷,没办法,大部分翻译过来的书籍都被喷,想要不吃别人嚼过的东
    西,就好好学习英文吧。
  5. 《AI, Modern Approach 2nd》 PDF95
    Peter Norvig,无争议的领域经典。
  6. 《Foundations of Statistical Natural Language Processing》 PDF71
    自然语言处理领域公认经典。
  7. 《Information Theory:Inference and Learning Algorithms》 PDF35
  8. 《Statistical Learning Theory》 PDF76
    Vapnik的大作,统计学界的权威,本书将理论上升到了哲学层面,他的另一本书《The Nature ofStatistical Learning Theory》也是统计学习研究不可多得的好书,但是这两本书都比较深入,适合有一定基础的读者。

数学基础

  1. 《矩阵分析》 PDF246
    Roger Horn。矩阵分析领域无争议的经典
  2. 《概率论及其应用》 PDF85
    威廉·费勒。极牛的书,可数学味道太重,不适合做机器学习的
  3. 《All Of Statistics》 PDF 扫描版78 PDF
    高清版164

    机器学习这个方向,统计学也一样非常重要。推荐All of statistics,这是CMU的一本很简洁的教科书,注重概念,简化计算,简化与Machine Learning无关的概念和统计内容,可以说是很好的快速入门材料。
  4. 《Nonlinear Programming, 2nd》 PDF69
    最优化方法,非线性规划的参考书。
  5. 《Convex Optimization》 PDF88 配套代码56
    Boyd的经典书籍,被引用次数超过14000次,面向实际应用,并且有配套代码,是一本不可多得的好书。
  6. 《Numerical Optimization》 PDF64
    第二版,Nocedal著,非常适合非数值专业的学生和工程师参考,算法流程清晰详细,原理清楚。
  7. 《Introduction to Mathematical Statistics》 PDF28
    第六版,Hogg著,本书介绍了概率统计的基本概念以及各种分布,以及ML,Bayesian方法等内容。
  8. 《An Introduction to Probabilistic Graphical Models》 PDF118
    Jordan著,本书介绍了条件独立、分解、混合、条件混合等图模型中的基本概念,对隐变量(潜在变量)也做了详细介绍,相信大家在隐马尔科夫链和用Gaussian混合模型来实现EM算法时遇到过这个概念。
  9. 《Probabilistic Graphical Models-Principles and Techniques》 PDF71
    Koller著,一本很厚很全面的书,理论性很强,可以作为参考书使用。
  10. 具体数学 PDF69
    经典
时间: 2024-10-03 13:45:05

转:机器学习资料书籍的相关文章

机器学习资料与攻略超强整理吐血推荐(二)

在前文<机器学习资料与攻略超强整理吐血推荐(一)>中,我们讲到要进入人工智能的圈子,数学是不可逾越的第一关,然后我们又推荐了一些你必须掌握的数学方面的资料.接下来,在这一篇中,我们将介绍关于机器学习的理论与工具方面的资料. 二.工具篇 工欲善其事,必先利其器.大数据时代,人工智能的工具趋势是显而易见且确定无疑的.作为一名数据科学家,其实你可以选择的工具非常多,其实随着时代的发展和技术的演进,传统的SPSS.STATA和SAS等这些老牌数据分析工具都已经集成了机器学习和数据挖掘的模块.当然,这不

机器学习资料收集

Harvard机器学习资料(video) http://cm.dce.harvard.edu/2011/02/23101/publicationListing.shtml 1. ml-class.org 级别相当于S校的CS229A,注重Application,适合大二的学生学习,产生兴趣.但这个理论性差的太多,按Ng的说法是计算机系的学这个只能给个C 2. CS229 see.stanford.edu有SCPD的视频作业等等,我现在正在学习,正常的Advanced Undergraduate/

[转]机器学习经典书籍

算法组 注册 登录 机器学习经典书籍 机器学习 machine-learning 书单 你已经选择了 0 个帖子. 全选 取消选择 1 / 6 sys 14-12-9 5 选择以及回复其的帖子 选择 前面有一篇机器学习经典论文/survey合集223.本文总结了机器学习的经典书籍,包括数学基础和算法理论的书籍.本文会保持更新,欢迎推荐. 入门书单 <数学之美> PDF364作者吴军大家都很熟悉.以极为通俗的语言讲述了数学在机器学习和自然语言处理等领域的应用. <Programming C

挑选合适的机器学习资料

挑选合适的机器学习资料 商业人群 对机器学习感兴趣的商务人士 在项目中应用机器学习的经理人 学术人群 机器学习专业的本科生或研究生 机器学习领域的研究人员 利用机器学习建模的其他领域的研究人员 工程人群 实现算法的编程人员 交付一次性预测信息的开发人员 改进软件和服务的工程师 数据人群 希望获得商业问题优化方案的数据科学家 希望能更好地解释数据的数据分析师 商业人群 通常来讲,这类人群希望在商业上有效地使用机器学习,但并不需要掌握其算法或工具的实现细节.在商业领域,机器学习技术已经广泛地用于预测

机器学习经典书籍&amp;论文

原文地址:http://blog.sina.com.cn/s/blog_7e5f32ff0102vlgj.html 入门书单 1.<数学之美>PDF6 作者吴军大家都很熟悉.以极为通俗的语言讲述了数学在机器学习和自然语言处理等领域的应用. 2.<Programming Collective Intelligence>(<集体智慧编程>)PDF3 作者Toby Segaran也是<BeautifulData : The Stories Behind Elegant

前端学习资料(书籍和视频)

1.妙味课堂--jquery源码分析视频   2.前沿视频教室<精通JavaScript视频教程>    3.妙味课堂javascript+jquery视频教程 前端学习资料(书籍和视频)

机器学习经典书籍

前面有一篇机器学习经典论文/survey合集331.本文总结了机器学习10的经典书籍,包括数学基础和算法理论的书籍.本文会保持更新,欢迎推荐. 入门书单 <数学之美> PDF683作者吴军大家都很熟悉.以极为通俗的语言讲述了数学在机器学习和自然语言处理等领域的应用. <Programming Collective Intelligence>(<集体智慧编程>)PDF389作者Toby Segaran也是<BeautifulData : The Stories Be

【转】机器学习资料汇总

想做机器学习,推荐下面资料: C++计算机视觉 CCV —基于C语言/提供缓存/核心的机器视觉库,新颖的机器视觉库 OpenCV—它提供C++, C, Python, Java 以及 MATLAB接口,并支持Windows, Linux, Android and Mac OS操作系统. 通用机器学习 MLPack DLib ecogg shark Closure通用机器学习 Closure Toolbox—Clojure语言库与工具的分类目录 Go自然语言处理 go-porterstemmer—

(转)机器学习经典书籍

入门书单 <数学之美> PDF 作者吴军大家都很熟悉.以极为通俗的语言讲述了数学在机器学习和自然语言处理等领域的应用. <Programming Collective Intelligence>(<集体智慧编程>)PDF 作者Toby Segaran也是<BeautifulData : The Stories Behind Elegant Data Solutions>(<数据之美:解密优雅数据解决方案背后的故事>)的作者.这本书最大的优势就是里