Source: http://www.openlab.co/forums/thread/413856/1
1. 机器学习
作者: (美)Tom Mitchell
出版社: 机械工业出版社
评语 : 现在看来,这本书也许是过时了。但在那个年代,这是开天辟地的一本书。第一章就清楚定义了什么是ML:本质是在给定的搜索空间和计算资源下,近似一个函数。 <RET> 虽然今天大家都用统计的手段来研究ML,模型和优化算法都有了极大的发展,应用也更加五花八门,计算能力和当年更不是一个数量级。不过,看看这本书哪些观点过时了,哪些观点现在仍然是公认的,也是一件很好玩的事情。
2. The Elements of Statistical Learning
作者: Trevor Hastie/Robert Tibshirani/Jerome Friedman
出版社: Springer
评语 : 作者都是正统统计出身大牛,说是element,其实一点也不。06年刚学ml时啃它,没懂,再啃一遍,还是没懂。3年后继续,才觉得博大精深。当然,中文翻译得拗口也有一定原因,所以还是看原版把,都可以从作者主页免费下的。 <RET> 这本书读起来更像是product review,在介绍的同时夹杂了大量算法模型优缺点对比,这当然是作者功力的显现,但不适合初学者。第二版较以前新加了大量关于sparse model的章节,很推荐。不过,对graphic model等似乎写得过于简略了。
3. Pattern Recognition And Machine Learning
作者: Christopher M. Bishop
出版社: Springer
评语 : 不同于楼上的ESL,这本几乎完全是bayesian的观点,graphic model章节自然是亮点。不过,最大的特点是覆盖面广,写得非常的通俗易懂。即使是用bayesian这种公式相对多,概念相对绕的表述,bishop仍然举重若轻,写得文笔流畅,洋洋洒洒。所以非常适合入门。
4. Machine Learning - A Probabilistic Perspectiv
作者: Kevin P. Murphy
出版社: The MIT Press
评语 : 观点介于楼上PRML的bayesian和楼上上ESL的frequentist之间,1000+页,cover面非常之广,从经典模型算法到当下的stochastic optimization, deep learning. 公式不多,语言简练,通俗易懂。非常适合初学者。 <RET> 缺点是,这似乎更像是一本百科全书。一个词条接一个词条,读起来破为无趣。
5. Learning From Data
作者: Yaser S. Abu-Mostafa/Malik Magdon-Ismail/Hsuan-Tien Lin
出版社: AMLBook
评语 : 对这本书没有太多评价,不过Yaser在caltech的课上得很精彩。对ml的很多概念有非常直白的解释。当年他在主页上公开鄙视Adrew Ng的ML公开课,也是有一定道理。http://work.caltech.edu/telecourse.html
6. Foundations of Machine Learning
作者: Mehryar Mohri/Afshin Rostamizadeh/Ameet Talwalkar
出版社: The MIT Press
评语 : 和ESL一样,也是用的frequentist的观点,也是一点都不foundation。不同是,作者都是CS出身,所以写的味道更CS点。如果对bound有爱就读吧。
7. Bayesian Reasoning and Machine Learning
作者: David Barber
出版社: Cambridge University Press
评语 : 彻底的Bayesian。还木有读。
8. Machine Learning for Hackers
作者: Drew Conway/John Myles White
出版社: O‘Reilly Media
评语 : 手把手教如何用ML来解决诸如垃圾邮件过滤之类的应用,用R。
9. Machine Learning in Action
作者: Peter Harrington
出版社: Manning Publications
评语 : 还是讲如何跑ML算法,用python。可以认为是源代码+注释+实验结果贴图。
10. Data Mining
作者: Han, Jiawei; Kamber, Micheline; Pei, Jian
评语 : 好吧。和楼下这本一起,是data mining教材。如果不想看公式的话,这是可选读物。
11. Data Mining
作者: Ian H. Witten/Eibe Frank/Mark A. Hall
出版社: Morgan Kaufmann
评语 : weka是data mining里最有名的工具包,这是使用手册。