机器学习的相关书籍

《Introduction to Data Mining》

《Data Mining : Concepts and Techniques》

《Introduction to Machine Learning》

《机器学习:实用案例解析》

《Pattern Recognition and Machine Learning》

《The Elements of Statistical Learning》

《Machine Learning: A Probabilistic Perspective》

第一本比较偏Bayesian;第二本比较偏Frequentist;第三本在两者之间,但我觉得跟第一本差不多,不过
加了不少新内容。当然除了这几本大而全的,还有很多介绍不同领域的书,例如《Boosting Foundations and
Algorithms》,《Probabilistic Graphical Models Principles and
Techniques》;以   及理论一些的《Foundations of Machine Learning》,《Optimization
for Machine Learning》等等。这些书的课后习题也非常有用,做了才会在自己写Paper的时候推公式。

论文
包括几个相关会议:KDD,ICML,NIPS,IJCAI,AAAI,WWW,SIGIR,ICDM;以及几个相关的期刊:TKDD,TKDE,JMLR,PAMI等。跟踪新技术跟新的热点问题。当然,如果做相关research,这一步是必须的。例如我们组的风格就是上半年读Paper,暑假找问题,秋天做实验,春节左右写/投论文。

经典算法。有几个部分:
a. 关联规则挖掘 (Apriori, FPTree, etc.)
b. 分类 (C4.5, KNN,
Logistic Regression, SVM, etc.)
c. 聚类 (Kmeans, DBScan, Spectral Clustering,
etc.)
d. 降维 (PCA, LDA, etc.)
e. 推荐系统
(基于内容的推荐,协同过滤,如矩阵分解等)
然后在公开数据集上测试,看实现的效果。可以在下面的网站找到大量的公开数据集:UCI Machine
Learning Repository/

3. 跟踪热点问题。例如最近几年的Recommendation System,Social Network,Behavior
Targeting等等,很多公司的业务都会涉及这些方面。以及一些热点技术,例如现在很火的Deep Learning。
4.
学习大规模并行计算的技术,例如MapReduce、MPI,GPU
Computing。基本每个大公司都会用到这些技术,因为现实的数据量非常大,基本都是在计算集群上实现的。
5.
参加实际的数据挖掘的竞赛,例如KDDCUP,或 Kaggle: Go from Big Data to Big Analytics/
上面的竞赛。这个过程会训练你如何在一个短的时间内解决一个实际的问题,并熟悉整个数据挖掘项目的全过程。
6.
参与一个开源项目,如上面提到的Shogun或scikit-learn还有Apache的Mahout,或为一些流行算法提供更加有效快速的实现,例如实现一个Map/Reduce平台下的SVM。这也是锻炼Coding的能力。

机器学习的相关书籍,布布扣,bubuko.com

时间: 2024-12-21 18:17:42

机器学习的相关书籍的相关文章

从零实现来理解机器学习算法:书籍推荐及障碍的克服

前部为英文原文,原文链接:http://machinelearningmastery.com/understand-machine-learning-algorithms-by-implementing-them-from-scratch/ 后部为中文翻译,本文中文部分转自:http://www.csdn.net/article/2015-09-08/2825646 Understand Machine Learning Algorithms By Implementing Them From

程序员调试能力和相关书籍

在软件行业中,个人觉得每个Coder.Leader(那些当了Leader以后就不需要Code的除外)都应该除了具有良好的编码能力以外,最为主要的就是Debug的能力要坚实.千万不要告诉我Debug工作是Tester和QA的事情,首先你要认识到Debug的能力是一个并不简单的能力,能帮助你提高你的开发能力,加快开发速度,节约开发成本:其次你更应该知道,你所掌握的Debug的能力和技术并不可能抢去Tester或者QA的饭碗,他们做的工作更仔细.全面,更富有创造力.由于本人数年来一直使用VC6,所以下

hacker入门篇——相关书籍

1.<黑客大曝光:网络安全机密与解决方案(第7版)> 简介:这是一本老外写的书,比较适合入门看,内容包括一些基本的攻防流程,基本工具软件,网络安全的一些基本概念等,对整个网络安全和黑客入侵都有比较全面的介绍.对Windows和Unix系统做了分别得介绍,新版(第7版)还对现今新兴技术无线网.移动设备等方面的安全知识做了介绍.虽然关于具体细节的介绍比较少,但通过这本书可以让初学小白们对黑客有一个全面完整的认识.推荐作为第一本读物阅读. PDF: 第六版:http://pan.baidu.com/

SQL Server相关书籍

SQL Server相关书籍 SQLServer2012实施与管理实战指南 SQL Server 2008学习笔记:日常维护.深入管理.性能优化 SQL Server 2008 R2数据挖掘与商业智能基础及高级案例实战 SQL Server 2012 深入解析与性能优化(第3版) SQLServer2012IntegrationServices高级教程(第2版) SQL Server 2008管理员必备指南 SQL Server 2008报表服务从入门到精通 SQL Server2012管理高级

设计模式相关书籍推荐

很多朋友问学习设计模式的书籍,老大沧浪在FAQ里有个简短的叙述,这里我引申一下,说说自己看过或者翻过的设计模式书籍,由于水平所限,肯定有不对的地方,希望大家指正,如果大家看到好的模式相关书籍,希望能回帖补充. 首 先模式是不分语言的,Beck在他的TDD一书中用python实现了Composite模式,充分证明了这一点.不过我认为目前模式方面的好书基本都是 基于java语言的,所以不管你是用C#还是CPP,都请学会阅读java代码,毕竟现在OO和模式还是有java社群引领的. 我将按照初级,中级

顶级的机器学习和数据挖掘书籍

顶级的机器学习和数据挖掘书籍--在这篇评论中,我们从100本机器学习和数据挖掘的书中收集了各种要素(例如在线评论/评级,涵盖的主题,作者在行业内的权威性,价格,等等).我们用这些要素来计算出每本书的质量评分,并列出了个人读过的一些机器语言/数据挖掘/自然语言处理的书籍. 买家会喜欢我们的列表,因为它是根据数据处理得出的,非常客观.读者应该注意到这里列出的所有书籍是从100本在售书籍中精选出来的优秀书籍,质量极高.让我们看看列表吧: 1.统计学习导论:在R中的应用 61.36美元 质量评分:10/

软件测试体系相关书籍-未完成

发现对于一个做技术的人员来说,如果能看到一本好的技术书籍会使自己少走很多的弯路,在次罗列下自己看过且觉得比较好且对自己有帮助的书籍: 1.软件测试 2.性能测试 3.web 4.数据库 5.操作系统 6.开发语言 软件测试体系相关书籍-未完成

数据库相关书籍推荐

数据库相关书籍推荐 1.<SQL必知必会(第4版)> <SQL必知必会(第4版)> 书籍介绍: SQL语法简洁,使用方式灵活,功能强大,已经成为当今程序员不可或缺的技能. 本书是深受世界各地读者欢迎的SQL经典畅销书,内容丰富,文字简洁明快,针对Oracle.SQL Server.MySQL.DB2.PostgreSQL.SQLite等各种主流数据库提供了大量简明的实例.与其他同类图书不同,它没有过多阐述数据库基础理论,而是专门针对一线软件开发人员,直接从SQL SELECT开始,

Python金融分析相关书籍推荐

Python是一门比较全面与平衡的语言,既能满足包括web在内的系统应用的开发,又能满足数据统计分析等数学领域的计算需求,同时也能作为胶水语言跟其它开发语言互通融合.在数据分析方面,没有其他语言能像Python这样既能精于计算又能保持性能,对于时间序列数据的处理展现了简单便捷的优势.下面是有关金融分析和量化交易的书籍推荐. 1.<Python金融大数据分析> 书籍介绍: <Python金融大数据分析>详细讲解使用Python分析处理金融大数据的专业图书:金融应用开发领域从业人员必读