入门版
适合对数据分析的入门者,对数据分析没有整体概念的人,常见于应届毕业生,经验尚浅的转行者。
1.深入浅出数据分析 (豆瓣):HeadFirst 类的书籍,一向浅显易懂形象生动,可以对分析概念有个全面的认知。电子工业出版社的经典书目系列,从数据分析基本步骤开始、实验方法、最优化方法、假设检验方法、贝叶斯统计方法、主观概率法、启发法、直方图法、回归法、误差处理、相关数据库、数据整理技巧一一讲到。图比较多,适合入门。
2.谁说菜鸟不会数据分析 (豆瓣):不仅讲解了一些常见的分析技巧,并附带 Excel 的一些知识以及数据分析在公司中所处的位置,对职场了解亦有一定帮助。
3.赤裸裸的统计学 (豆瓣):作者年轻时是个追求学习意义的学霸,后来自己从统计学中发掘了很多可以应用到生活的地方。这也是本书的主旨,结合生活讲解统计知识,生动有趣。可以避免统计学一上来就大讲贝叶斯概率和随机分析的枯燥。
同样类似的书籍还有「统计数字会撒谎 (豆瓣)」,这本书知名度要高点,不过我还没看…
4.深入浅出统计学 (豆瓣):Headfirst 类书籍,可以帮助你快速了解统计方面的知识。
5.「网站分析实战 (豆瓣)」,是国内一本讲网站分析的书,没有上面经典,但胜在新出,很多案例和理念都有及时的更新。
6.《数据之魅-基于开源工具的数据分析》链接:数据之魅 (豆瓣)
7.者是华盛顿大学理论物理学博士。这本书是数据分析的经典之一,包含大量的R语言模拟过程及结果展示,例举了很多数据分析实例和代码。
8.《数据挖掘-市场营销、销售与客户关系管理领域应用》链接:数据挖掘技术 (豆瓣),
作者是Data Miners的创办人,有二十多年的营销和客户关系管理结合数据挖掘的经验。详细介绍了作为一个数据挖掘团队需要的知识体系,包括数据库、SAS使用、统计学、机器学习、数据可视化、如何访问用户收集需求、如何写论文与沟通等等。有条件的建议看英文原版。
9.《Data Analytics for Beginners: Basic Guide to Master Data Analytics》
入门五星推荐。里面很多图表实例,手把手教你如何EXCEL画图,对各种知识点(平均值,模式,中值,方差,标准偏差)的讲解相当的到位,比起大学里的各种课本靠谱。
10.统计学基础书可以看一下::统计学习三大巨匠Trevor Hastie, Robert Tibshirani和Friedman《the elements of statistical learning》了,也提到了Trevor Hastie, Robert Tibshirani的13年的新书《An Introduction to Statistical Learning: with Application in R》
《the elements of statistical learning》中文版是清华大学出的版社的《统计学习基础》,这个嘛,不推荐,翻译得不好,很多术语和表述都不够"统计",但是我认为能翻译巨作的,都是有贡献的。
《An Introduction to Statistical Learning: with Application in R》的中文版是机械工业出版社的《统计学习导论:基于R的应用》,15年6月份出来的新书,译者和原书作者都是在同一个领域搞研究的,可以说是同宗同源啦,水平也是相当高的;以前找我推荐书的,都被安利了这本;甚至还有书还没上市就被我安利的人...
也有回答提到了吴喜之老师的《从数据到结论》,其实我会更加推荐吴喜之老师的另外一本《统计学:从概念到数据分析》,这本书搜索成本比《从数据到结论》要稍微高一点,吴老师一惯的风格,书特别薄,三言两语点透方法的精髓;而且也都有R代码;
进阶版
1.《Doing Data Scienc》中文版图书链接:https://book.douban.com/subject/26320485/
作者Cathy O’Neil是哈佛大学的博士,MIT的数据博士后,曾今作为一名Quant在对冲基金D.E. Shaw 工作,目前是一家纽约初创公司的Data scientist 。这本书需要有一定的编程和理论基础,作为入门教材来说有点难,虽然只有400来页,但是涉及的知识点很全面。每一章节的核心内容都附有编程案例,R/Python/Shell三种语言任君挑选。
2.《Python for Data Analysis》中文版图书链接:https://book.douban.com/subject/25779298/
Python数据分析必看,适合入行不久的数据分析师。作者有多年的Python数据分析工作经验,对各种Pyhon包iPython,NumPy,pandas,matpotlib等有着很深的理解。看完这本,敲完代码,Python数据分析就算入行了。
很多牛人为之作序,数据科学如何与商业结合,相信这本书会给你一些启发。
4.《Python Data Science Handbook》一本包含Python数据分析各个包的工具书,比如numpy pandas matplotlib scikit learn等,便于学习查阅使用。
2016年6月出版的,500页保质保量,作者(Jake VanderPlas)是华盛顿大学电子科学研究所的高级数据科学研究员,研究领域包括天文统计学、机器学习和可扩展计算。书的前半部分介绍了用于数据分析和一般的科学计算的基本Python库,后面从实际应用的角度使用Python库scikit-learn开始机器学习实践。适合有一定Python基础人(或者R基础),并且想学习如何使用Python进行数据分析的人。
作者Cole NussbaumerKnaflic,私募分析师,前Google人力分析团队总监。本书展示了如何高效率展示量化资讯,如何用丰富的资料讲故事。Google内部的数据可视化课程讲师,之前也在Maryland Institute College of Art兼职讲师。如果你想知道如何以图叙事,这边好书不容错过。
这些推荐全部转载于知乎如下坐着的推荐,仅作为本人学习目的用途。
作者:呆小槑
链接:https://www.zhihu.com/question/19640095/answer/90456737
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
作者:Han Hsiao
链接:https://www.zhihu.com/question/19640095/answer/24240031
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
作者:张溪梦 Simon
链接:https://www.zhihu.com/question/20757000/answer/119738611
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。