python数据分析的要求并不是软件开发的要求,确实,对于一门工具,不同目的的使用者,需要的技能是不一样的,比如刀这个工具,屠夫用它是杀猪的,厨师用它是切菜的,军人用它是保家卫国的,客人用它是切牛排的,每个人用的方式都不一样,对于刀的掌握方法都有特定的要求。
python数据分析,就如同学excel做数据分析一样,都是从了解python如何打开使用,如何在里面处理数据,如何筛选数据,如何统计分析,如何图表展示。python只是工具,关键还是处理问题的思维方法。我们学习python的目的不是为了写网站、写应用软件、写爬虫工具,而是数据分析,所以我们的范围就缩小到python是什么和如何使用基本功能,以及如何数据分析两个大内容。
python数据分析,步骤有三:
步骤一、基本上用Numpy库做统计计算。这就如同excel里面“数据”菜单里面的那些统计汇总函数的功能。
步骤二、学习使用pandas,它的出生(2009年开源)就是为了用于金融数据分析。pandas是在Numpy的基础上开发的工具。使得统计更加方便。
步骤三、matplotlib是python在数据分析展示时用的比较主要的库,此外,还有很多图形库是基于matplotlib开发的,显示效果会更加友好和方便。如vispy,bokeh, seaborn, pyga, folium 和networkx,这7种图形工具库的简单使用可以参见http://python.jobbole.com/84218/介绍。不过,我个人觉得并不是一定要做数据展示的,还是那句话,看每位使用者的需求是什么。
我开始学习啦……
参考网页
http://www.cnblogs.com/nxld/p/6058998.html
http://python.jobbole.com/84218/