1、要用python做数据分析,先得对python语言熟悉,推荐一本入门书 :笨方法学python (learn python the hard way),这本书用非常有趣的讲述方式介绍了python的基本语法,非常适合非计算机专业作为入门书来看。
2、用python做数据分析的话,推荐用 anaconda,地址https://www.anaconda.com/download/ ,可以根据需要选择版本
3、后面需要添加各种包的时候,在开始-所有程序,打开Anaconda prompt,输入 pip install package_name 命令,运行,就可以完成安装,这里的package_name是需要安装的包的名称,比如,需要安装 numpy ,可以输入 pip install numpy,点回车,就可以了。
今天遇到一个问题,如果提示 :
You are using pip version 10.0.1, however version 18.0 is available.
You should consider upgrading via the ‘python -m pip install --upgrade pip‘ command.
则说明pip版本太低,先按照提示输入 python -m pip install --upgrade pip 升级pip,然后再次安装所需要的包就好了。
4、学完入门书之后,就需要针对性的学习如何用python做数据分析了,推荐一本书:利用python进行数据分析 ,这本书主要介绍了数据分析常用的几个模块:numpy、pandas、matplotlib,以及数据预处理需要的数据加载、清理、转换、合并、重塑等等,建议从第4章开始看,看完后,再接着看前3章。很多新接触的人从头开始看容易一头雾水,看不下去,接着就放弃了。
5、做数据挖掘必须要懂机器学习的各种算法,我比较推荐的一本也是非常有名的一本书:机器学习(周志华著、清华大学出版社),因为封皮和书中的例子多以西瓜为例,所以别名西瓜书。
6、关于文本分析的一本非常好的书:数学之美,写的很棒
原文地址:https://www.cnblogs.com/xiyouzhi/p/9403350.html