Python3数据分析与挖掘建模实战视频

第1章 课程介绍【赠送相关电子书+随堂代码】

本章首先介绍本课程是什么,有什么特色,能学习到什么,内容如何安排,需要什么基础,是否适合学习这门课程等。然后对数据分析进行概述,让大家对数据分析的含义和作用有一个整体的认知,让大家对自己接下来要做的事情,有一个基本的概念与了解。...

1-1 课程导学

1-2 数据分析概述

第2章 数据获取

数据从哪里来?怎么来?这一章,我们会介绍数据获取的一般手段。主要包括数据仓库、抓取、资料填写、日志、埋点、计算等手段。同时,我们也会介绍几个常用的数据网站,供大家参考与学习。

2-1 数据仓库

2-2 监测与抓取

2-3 填写、埋点、日志、计算

2-4 数据学习网站

第3章 单因子探索分析与数据可视化

有了数据,如何上手?这一章,我们会介绍探索分析的一部分---单因子探索分析和可视化的内容。我们会以基础的统计理论知识为切入点,学习异常值分析、对比分析、结构分析、分布分析。同时,引入接下来几章都会用到的案例-HR人力资源分析表,并用理论与可视化的方法,完成对此表的初步分析。...

3-1 数据案例介绍3-2 集中趋势,离中趋势3-3 数据分布--偏态与峰度3-4 抽样理论3-5 编码实现(基于python2.7)3-6 数据分类3-7 异常值分析3-8 对比分析3-9 结构分析3-10 分布分析3-11 Satisfaction Level的分析3-12 LastEvaluation的分析3-13 NumberProject的分析3-14 AverageMonthlyHours的分析3-15 TimeSpendCompany的分析3-16 WorkAccident的分析3-17 Left的分析3-18 PromotionLast5Years的分析3-19 Salary的分析3-20 Department的分析3-21 简单对比分析操作3-22 可视化-柱状图3-23 可视化-直方图3-24 可视化-箱线图3-25 可视化-折线图3-26 可视化-饼图3-27 本章小结

第4章 多因子探索分析

上了手,然后呢?这一章,我们介绍探索分析的另一部分---多因子复合探索分析。我们同样以基础的统计知识为切入点,学习多因子间互相影响与配合的分析方法,如交叉分析、分组分析、相关分析、成分分析等。同时,以HR人力资源分析表为例,进行进一步的探索。...

4-1 假设检验

4-2 卡方检验

4-3 方差检验

4-4 相关系数

4-5 线性回归

4-6 主成分分析

4-7 编码实现

4-8 交叉分析方法与实现

4-9 分组分析方法与实现

4-10 相关分析与实现

4-11 因子分析与实现

4-12 本章小结

第5章 预处理理论

数据已了解,用起来!不着急,先加工。这一章,我们会介绍特征工程的主要内容,重点会介绍数据清洗和数据特征预处理的主要内容,包括数据清洗、特征获取、特征处理(内含对指化、归一化、标准化等)、特征降维、特征衍生。预处理的好坏,直接影响着接下来模型的效果。...

5-1 特征工程概述

5-2 数据样本采集

5-3 异常值处理

5-4 标注

5-5 特征选择

5-6 特征变换-对指化

5-7 特征变换-离散化

5-8 特征变换-归一化与标准化

5-9 特征变换-数值化

5-10 特征变换-正规化

5-11 特征降维-LDA

5-12 特征衍生

5-13 HR表的特征预处理-1

5-14 HR表的特征预处理-2

5-15 本章小结

第6章 挖掘建模

把数据用起来!这一章,我们会介绍数据挖掘与建模的主要内容。主要包含五类模型的建立与实践,分别为:分类模型(KNN、朴素贝叶斯、决策树、SVM、集成方法、GBDT……),回归模型与回归思想分类(线性回归、逻辑斯特回归【也叫罗吉回归,逻辑回归。音译区别】、神经网络、回归树),聚类模型(K-means、DBSCAN、层次聚类、...

6-1 机器学习与数据建模

6-2 训练集、验证集、测试集

6-3 分类-KNN

6-4 分类-朴素贝叶斯

6-5 分类-决策树

6-6 分类-支持向量机

6-7 分类-集成-随机森林

6-8 分类-集成-Adaboost

6-9 回归-线性回归

6-10 回归-分类-逻辑回归

6-11 回归-分类-人工神经网络-1

6-12 回归-分类-人工神经网络-2

6-13 回归-回归树与提升树

6-14 聚类-Kmeans-1

6-15 聚类-Kmeans-2

6-16 聚类-DBSCAN

6-17 聚类-层次聚类

6-18 聚类-图分裂

6-19 关联-关联规则-1

6-20 关联-关联规则-2

6-21 半监督-标签传播算法

6-22 本章小结

第7章 模型评估

哪个模型好?上一章,我们学习了很多模型,一个数据集,可能用多种模型都可以进行建模,那么哪种模型好,就需要有些指标化的东西帮我们决策。这一章,我们会介绍使用混淆矩阵和相应的指标、ROC曲线与AUC值来评估分类模型;用MAE、MSE、R2来评估回归模型;用RMS、轮廓系数来评估聚类模型。...

7-1 分类评估-混淆矩阵

7-2 分类评估-ROC、AUC、提升图与KS图

7-3 回归评估

7-4 非监督评估

第8章 总结与展望

这一章,我们将回顾本课程的全部内容,并从多个角度,重新看待我们的数据分析工作。最后,我们会了解到,学习了这门课程以后,还可以在哪些方面进行发展。

8-1课程回顾与多角度看数据分析8-2大数据与学习这门课后还能干什么?

下载地址;百度网盘百度网盘下载

原文地址:http://blog.51cto.com/13928183/2161351

时间: 2024-11-09 10:06:27

Python3数据分析与挖掘建模实战视频的相关文章

Python3数据分析与挖掘建模实战

Python3数据分析与挖掘建模实战网盘地址:https://pan.baidu.com/s/1lSjsPL1dskDbEsceNTvstg 密码: wdts备用地址(腾讯微云):https://share.weiyun.com/5AQkJBC 密码:bj2veb 流程完整:从头到尾经历一次完整的流程让你弄清数据分析与建模的来龙去脉 案例丰富:几乎每个知识点都配有具体的小案例在实战中掌握岗位要求的技能与技巧 知识全面:从基本概念.公式原理.实用技巧到背后的思维方法,掌握数据分析每 第1章 课程介

下载零基础数据分析与挖掘R语言实战课程(R语言)

随着大数据在各行业的落地生根和蓬勃发展,能从数据中挖金子的数据分析人员越来越宝贝,于是很多的程序员都想转行到数据分析,挖掘技术哪家强?当然是R语言了,R语言的火热程度,从TIOBE上编程语言排名情况可见一斑.于是善于学习的程序员们开始了R语言的学习之旅.对于有其他语言背景的程序员来说,学习R的语法小菜一碟,因为它的语法的确太简单了,甚至有的同学说1周就能掌握R语言,的确如此.但是之后呢?……好像进行不下去了!死记硬背记住了两个分析模型却不明其意,输出结果如同天书不会解读,各种参数全部使用缺省值,

《MATLAB数据分析与挖掘实战》赠书活动

<MATLAB数据分析与挖掘实战>是泰迪科技在数据挖掘领域探索10余年经验总结与华南师大.韩山师院.广东工大.广技师 等高校资深讲师联合倾力打造的巅峰之作.全书以实践和实用为宗旨,深度与广度兼顾,实践与理论并举. 本书特色:本书作者从实践出发,结合大量数据挖掘工程案例及教学经验,以真实案例为主线,深入浅出介绍数据挖掘建 模过程中的有关任务:数据探索.数据预处理.分类与预测.聚类分析.时序预测.关联规则挖掘.智能推荐.偏差检测等. 因此,图书的编排以解决某个应用的挖掘目标为前提,先介绍案例背景提

零基础数据分析与挖掘R语言实战课程(R语言)

随着大数据在各行业的落地生根和蓬勃发展,能从数据中挖金子的数据分析人员越来越宝贝,于是很多的程序员都想转行到数据分析, 挖掘技术哪家强?当然是R语言了,R语言的火热程度,从TIOBE上编程语言排名情况可见一斑.于是善于学习的程序员们开始了R语言的学习 之旅.对于有其他语言背景的程序员来说,学习R的语法小菜一碟,因为它的语法的确太简单了,甚至有的同学说1周就能掌握R语言,的确如 此.但是之后呢?……好像进行不下去了!死记硬背记住了两个分析模型却不明其意,输出结果如同天书不会解读,各种参数全部使用缺

MATLAB数据分析与挖掘实战

这篇是计算机中数据库存储与管理类的优质预售推荐<MATLAB数据分析与挖掘实战>. 多位资深数据挖掘专家10余年实战经验结晶,深入讲解数据挖掘各个环节的各项技术. 编辑推荐 通过10余个真实的案例为10余个行业的数据挖掘提供了解决方案,并提供相关的建模文件和源代码. 前言部分  为什么要写这本书 LinkedIn 对全球超过3.3亿用户的工作经历和技能进行分析后得出,在目前最炙手可热的25项技能中,数据挖掘人才需求排名第一.那么数据挖掘是什么? 数据挖掘是从大量数据(包括文本)中挖掘出隐含的.

数据分析学习资料《利用Python进行数据分析第2版》+《Python数据分析与挖掘实战》+《从零开始学Python数据分析与挖掘》

数据分析涉及统计学.线性代数.图形分析绘制.数据挖掘等知识,推荐系统学习电子资料<利用Python进行数据分析第2版>.<Python数据分析与挖掘实战>.<从零开始学Python数据分析与挖掘>电子书和代码测试. <利用Python进行数据分析第2版>电子书代码,每一章之间有递进关系,适合在Python入门<Python编程从入门到实践>电子书之后阅读,本专门针对数据分析领域的.我细致地读了一遍,敲了一遍代码,一开始没有头绪,进展缓慢,后来逐渐

【Hadoop大数据分析与挖掘实战】(一)----------P19~22

这是一本书的名字,叫做[Hadoop大数据分析与挖掘实战],我从2017.1开始学习 软件版本为Centos6.4 64bit,VMware,Hadoop2.6.0,JDK1.7. 但是这本书的出版时间为2016.1,待到我2017.1使用时,一部分内容已经发生了翻天覆地的变化. 于是我开始写这么一个博客,把这些记录下来. 我使用的软件版本为: 软件 版本 操作系统 CentOS 7 64bit-1611 虚拟机 VMware 12.5.2 Hadoop 2.7.3 JDK 1.8.0 本人大二

【Hadoop大数据分析与挖掘实战】(三)----------P23~25

6.安装Hadoop 1)在Hadoop网站下,下载稳定版的并且已经编译好的二进制包,并解压缩. [[email protected] ~]$ wget http://mirrors.hust.edu.cn/apache/hadoop/common/hadoop-2.7.3/hadoop-2.7.3.tar.gz [[email protected] ~]$ tar -zxvf hadoop-2.7.3.tar.gz ~/opt [[email protected] ~]$ ~/opt/hado

hadoop大数据分析与挖掘实战(读书笔记1)

第一章节是从一个餐厅的角度出发,引出来许许多多的相关概念. 第一个概念就是什么是数据挖掘,这个简单,望文生义就好了.它的名字本身就诠释了它的内涵. 基本任务还是得记一下: 1分类与预测.(有点像量化,股票交易) 2聚类分析() 3关联规则() 4时序模式() 5偏差检测() 关于定义挖掘目标,就是什么菜品推荐,门店开在哪,这些问题.可以不多说. 关于数据取样,没啥好说的. 然后重点在后面, 数据质量分析:有缺失值怎么办?(就是统计一下缺失率什么的,然后删掉或者补值呗) 有异常值怎么办?(识别出来