第一课 Python入门
知识点1:Python安装
知识点2:常用数据分析库NumPy、Scipy、Pandas、matplotlib安装
知识点3:常用高级数据分析库scikit-learn、NLTK安装
知识点4:IPython的安装与使用
知识点5:Python2与Python3区别简介
实战项目:Python常用科学计算
第二课 准备数据与Numpy
知识点1:多维数组对象
知识点2:元素级别处理函数
知识点3:利用数组进行数据处理
知识点4:文件输入输出
知识点5:线性代数相关功能以及线性代数基础知识
知识点6:随机数的生成
实战项目:通过实际代码演示NumPy的多维数组与线性代数矩阵操作,以及数据输入输出
第三课 Python数据分析主力Pandas
知识点1:基本数据结构
知识点2:基本功能:索引,选取,过滤,排序...
知识点3:基本统计功能
知识点4:缺失数据处理
知识点5:层次化索引
实战项目:通过实际代码演示pandas处理及统计数据
第四课 数据获取与处理
知识点1:工业界常见数据格式与形态
知识点2:python对不同格式的数据读写
知识点3:pandas数据处理复习
知识点4:数据简易爬取与解析
知识点5:正则表达式:快捷捕捉你想要的信息
实战项目:简易网页爬取与数据解析处理
第五课 数据可视化Matplotlib
知识点1:信息可视化和数据可视化的基本原理
知识点2:常见可视化的方式
知识点3:如何针对数据特点设计可视化方案
实战项目:一典型可视化方式的实现(提供课堂ipython代码实例)
第六课 使用NLTK进行Python文本分析
知识点1:分词
知识点2:词性标注
知识点3:情感分析
知识点4:词形还原
知识点5:拼写检查
知识点6:文本分类
实战项目:一个典型文本分类流程的实现
第七课 python 社交网络分析igraph
知识点1:社交网络分析指标介绍
知识点2:pagerank算法
知识点3:igraph中多种社区发现算法介绍
实战项目:如何构造一个图,节点、边操作,以及基础图算法使用和可视化案例
第八课 Python机器学习scikit-learn
知识点1:scikit-learn简介
知识点2:机器学习的处理流程:以scikit-learn为例
知识点3:scikit-learn的优化方法(并行化处理,cython的使用等)
实战项目:以手写数字识别和房价预估为例,如何利用sklearn进行机器学习的特征转化、建模、可视化,以及最后的模型评估
第九课 数据科学完整案例
知识点1:数据获取与解析:你爱的足球队
知识点2:用“数据”的眼睛去看球:“一个人完成的央视数据统计”
知识点3:球员数据统计与可视化:“到底谁是最好的球员?”
实战项目:从抓取数据、解析数据、分析数据,到可视化、建模完整走一遍,从实际案例中一举窥探数学科学完整工作流程
第十课 Python分布式计算
知识点1:Python多进程模块Multiprocessing
知识点2:Python使用Hadoop分布式计算库mrjob
知识点3:Python使用Spark分布式计算库PySpark
实战项目:分别使用MapReduce和Spark实现wordcount
下载地址:
原文地址:https://www.cnblogs.com/52pg/p/9073916.html