《Spark MLlib机器学习实践》内容简介、目录

http://product.dangdang.com/23829918.html

Spark作为新兴的、应用范围最为广泛的大数据处理开源框架引起了广泛的关注,它吸引了大量程序设计和开发人员进行相关内容的学习与开发,其中 MLlib是 Spark框架使用的核心。本书是一本细致介绍 Spark MLlib程序设计的图书,入门简单,示例丰富。

本书分为 12章,从 Spark基础安装和配置开始,依次介绍 MLlib程序设计基础、MLlib的数据对象构建、MLlib中 RDD使用介绍,各种分类、聚类、回归等数据处理方法,最后还通过一个完整的实例,回顾了前面的学习内容,并通过代码实现了一个完整的分析过程。 本书理论内容由浅而深,采取实例和理论相结合的方式,内容全面而详尽,讲解细致直观,适合 Spark MLlib初学者、大数据分析和挖掘人员,也适合高校和培训学习相关专业的师生教学参考。

目录
第1章 星星之火
1.1 大数据时代
1.2 大数据分析时代
1.3 简单、优雅、有效——这就是Spark
1.4 核心——MLLib
1.5 星星之火,可以燎原
1.6 小结
第2章 Spark安装和开发环境配置
2.1 Windows单机模式Spark安装和配置
2.1.1 Windows 7安装Java
2.1.2 Windows 7安装Scala
2.1.3 Intellij IDE下载和安装
2.1.4 Intellij IDE中Scala插件的安装
2.1.5 Spark单机版安装
2.2 经典的WordCount
2.2.1 Spark实现WordCount
2.2.2 MapReduce实现WordCount
2.3 小结
第3章 RDD详解
3.1 RDD是什么
3.1.1 RDD名称的秘密
3.1.2 RDD特性
3.1.3 与其他分布式共享内存的区别
3.1.4 RDD缺陷
3.2 RDD工作原理
3.2.1 RDD工作原理
3.2.2 RDD的相互依赖
3.3 RDD应用API详解
3.3.1 使用aggregate方法对给定的数据集进行方法设定
3.3.2 提前计算的的cache方法
3.3.3 笛卡尔操作的cartesian方法
3.3.4 分片存储的coalesce方法
3.3.5 以value计算的countByValue方法
3.3.6 以key计算的countByKey方法
3.3.7 出去数据集中重复项的distinct方法
3.3.8 过滤数据的filter方法
3.3.9 以行为单位操作数据的flatMap方法
3.3.10 以单个数据为目标进行操作的map方法
3.3.11 分组数据的groupBy方法
3.3.12 生成键值对的keyBy方法
3.3.13 同时对两个数据进行处理的reduce方法
3.3.14 对数据进行重新排序的sortBy方法
3.3.15 合并压缩的zip方法
3.4 小结
第4章 MLLib基本概念
4.1 MLLib基本数据类型
4.1.1 多种数据类型
4.1.2 从本地向量集起步
4.1.3 向量标签的使用
4.1.4 本地矩阵的使用
4.1.5 分布式矩阵的使用
4.2 MLLib数理统计基本概念
4.2.1 基本统计量
4.2.2 统计量基本数据
4.2.3 距离计算
4.2.4 两组数据相关系数计算
4.2.5 分层抽样
4.2.6 假设检验
4.2.7 随机数
4.3 小结
第5章 协同过滤算法
5.1何为协同过滤
5.1.1 何为协同过滤
5.1.2 何为基于用户的推荐
5.1.3 何为基于物品的推荐
5.1.4 协同过滤算法的不足
5.2 相似度度量
5.2.1 基于欧几里得距离的相似度计算
5.2.2 基于余弦角度的相似度计算
5.2.3 欧几里得相似度与余弦相似度的比较
5.2.4 第一个例子——余弦相似度实战
5.3 MLLib中的交替最小二乘法(ALS算法)
5.3.1 最小二乘法(LS算法)详解
5.3.2 MLLib中交替最小二乘法(ALS算法)详解
5.3.3 ALS算法实战
5.4 小结
第6章 MLLIB线性回归理论与实战
6.1 随机梯度下降算法详解
6.1.1 道士下山的故事
6.1.2 随机梯度下降算法的理论基础
6.1.3 随机梯度下降算法实战
6.2 MLLib回归的过拟合
6.2.1 过拟合产生的原因
6.2.2 lasso回归与岭回归
6.3 MLLib线性回归实战
6.3.1 MLLib线性回归基本准备
6.3.2 MLLib线性回归实战:商品价格与消费者收入之间的关系
6.3.3 对拟合曲线的验证
6.4 小结
第7章 MLLib分类实战
7.1 逻辑回归详解
7.1.1 逻辑回归不是回归算法
7.1.2 逻辑回归的数学基础
7.1.3 一元逻辑回归示例
7.1.4 多元逻辑回归示例
7.1.5 MLLib逻辑回归验证
7.1.6 MLLib逻辑回归实例-胃癌的转移判断
7.2 支持向量机详解
7.2.1 三角还是圆
7.2.2 支持向量机的数学基础
7.2.3 支持向量机使用示例
7.2.4 使用支持向量机分析胃癌转移
7.3 朴素贝叶斯详解
7.3.1 穿裤子的男生or女生
7.3.2 贝叶斯定理的数学基础和意义
7.3.3 朴素贝叶斯定理
7.3.4 MLLib朴素贝叶斯使用示例
7.3.5 MLLib朴素贝叶斯实战——“僵尸粉”的鉴定
7.4 小结
第8章 决策树与保序回归
8.1 决策树详解
8.1.1 水晶球的秘密
8.1.2 决策树的算法基础-信息熵
8.1.3 决策树的算法基础——ID3算法
8.1.4 MLLib中决策树的构建
8.1.5 MLLib中决策树示例
8.1.6 随机雨林与梯度提升算法(GBT)
8.2 保序回归详解
8.2.1 何为保序回归
8.2.2 保序回归示例
8.3 小结
第9章 MLLib中聚类详解
9.1 聚类与分类
9.1.1 什么是分类
9.1.2 什么是聚类
9.2 MLLib中的Kmeans算法
9.2.1 什么是kmeans算法
9.2.2 MLLib中kmeans算法示例
9.2.3 Kmeans算法中细节的讨论
9.3 高斯混合聚类
9.3.1 从高斯分布聚类起步
9.3.2 混合高斯聚类
9.3.3 MLLib高斯混合模型使用示例
9.4 快速迭代聚类
9.4.1 快速迭代聚类理论基础
9.4.2 快速迭代聚类示例
9.5 小结
第10章 MLLib中关联规则
10.1 Apriori频繁项集算法
10.1.1 啤酒与尿布
10.1.2 经典的Apriori算法
10.1.3 Apriori算法示例
10.2 FP-growth算法
10.2.1 Apriori算法的局限性
10.2.2 FP-growth算法
10.2.3 FP树示例
10.3 小结
第11章 数据降维
11.1 奇异值分解(SVD)
11.1.1 行矩阵(RowMatrix)详解
11.1.2 奇异值分解算法基础
11.1.3 MLLib中奇异值分解示例
11.2 主成分分析(PCA)
11.2.1 主成分分析(PCA)的定义
11.2.2 主成分分析(PCA)的数学基础
11.2.3 MLLib中主成分分析(PCA)示例
11.3 小结
第12章 特征提取和转换
12.1 TF-IDF
12.1.1 如何查找我要的新闻
12.1.2 TF-IDF算法的数学计算
12.1.3 MLLib中TF-IDF示例
12.2 词向量化工具
12.2.1 词向量化基础
12.2.2 词向量化使用示例
12.3 基于卡方检验的特征选择
12.3.1 “吃货”的苦恼
12.3.2 MLLib中基于卡方检验的特征选择示例
12.4 小结
第13章 MLLib实战演练——鸢尾花分析
13.1 建模说明
13.1.1 数据的描述与分析目标
13.1.2 建模说明
13.2 数据预处理和分析
13.2.1 微观分析——均值与方差的对比分析
13.2.2 宏观分析——不同种类特性的长度计算
13.2.3 去除重复项——相关系数的确定
13.3 长与宽之间的关系——数据集的回归分析
13.3.1 使用线性回归分析长与宽之间的关系
13.3.1 使用逻辑回归分析长与宽之间的关系
13.4 使用分类和聚类对鸢尾花数据集进行处理
13.4.1 使用聚类分析对数据集进行聚类处理
13.4.2 使用分类分析对数据集进行分类处理
13.5 最终的判定——决策树测试
13.5.1 决定数据集的归类——决策树
13.5.2 决定数据集归类的分布式方法——随机雨林
13.6 小结

时间: 2024-10-15 03:35:58

《Spark MLlib机器学习实践》内容简介、目录的相关文章

《构建跨平台APP:PhoneGap移动应用实战》内容简介、目录

当当网链接 http://product.dangdang.com/23567381.html 内容简介 PhoneGap是一款优秀的移动跨平台开发框架,开发者通过它能够快速地将Web应用打包成在各个平台上运行的本地APP. 李柯泉.欧阳薇编著的<构建跨平台APP PhoneGap移动应用实战>分4篇共19章,第一篇是入门篇,包括了PhoneGap的小伙伴们.在安卓开发环境下的配置.对HTML 5前景的简单介绍.第二篇是基础知识篇,包含了设备信息.通讯录.加速度传感器.设备传感器.音频.文件.

构建跨平台APP开发的两本书,这里重点推荐下

第一本是<构建跨平台:jquery Mobile移动应用实战> 是目前jqm开发写的比较入门的一本书,上手很快,但是高手我觉得就没有必要学习了,因为写的比较浅显. 第二本是<构建跨平台:Phonegap移动应用实战> 写的也是很浅显,但是看完就能会phonegap了,感觉有部分公司的APP需要他.

小白学phoneGap《构建跨平台APP:phoneGap移动应用实战》连载一(PhoneGap中的API)

之前本博连载过<构建跨平台APP:jQuery Mobile移动应用实战>一书.深受移动开发入门人员的喜爱. 从如今開始,连载它的孪生姐妹书phoneGap移动应用实战一书,希望以前是小白的你们,已经变成了大白. 3.6  PhoneGap中的API能干什么 本章主要介绍进行PhoneGap开发前所须要做好的准备,那么如今是不是该介绍一些关于PhoneGap的事了呢?事实上PhoneGap就是将HTML写成的页面显示出来.然后通过特定的JavaScript获取几组数据而已. 尽管说使用Phon

小白学phoneGap《构建跨平台APP:phoneGap移动应用实战》连载三(通过实例来体验生命周期)

4.1.2  通过实例来亲身体验Activity的生命周期 上一小节介绍了Activity生命周期中的各个过程,本小节将以一个简单的实例来使读者亲身体验到Activity生命周期中的各个事件. 在Eclipse中新建一个Android工程,命名为example4_1,修改其MainActivity类中的内容如范例4-1所示. [范例4-1Activity生命周期的演示] 01 //此处省略若干个导入文件,由Eclipse自动生成 02 public classMainActivity exten

小白学phoneGap《构建跨平台APP:phoneGap移动应用实战》连载二(生命周期)

4.1 什么是生命周期 想要真正地理解PhoneGap应用开发的内涵,首先需要理解什么是生命周期.这在字面上其实非常容易理解,一个应用从开始运行被手机加载到应用被退出之间的过程就称之为一个生命周期.为了使读者更容易理解,本节将以Android原生SDK中Activity类的生命周期结合Eclipse中的LogCat调试工具进行实战讲解. 4.1.1  Activity的生命周期 先仔细的观察图4-1的内容,这是谷歌官方给出的Activity生命周期流程图,它包括了一个安卓应用从被创建到结束时所经

小白学phoneGap《构建跨平台APP:phoneGap移动应用实战》连载四(使用程序加载事件)

在了解了PhoneGap中都有哪些事件之后,本节将开始对这些事件的用法进行详细地介绍.本节要介绍的是程序加载事件,也就是deviceready.pause和resume这3个事件. [范例4-2 程序加载事件的使用] 01 <!DOCTYPE html> 02 <html> 03 <head> 04 <meta charset="utf-8"> 05 <title>程序加载事件的使用</title> 06 <

小白学phoneGap《构建跨平台APP:phoneGap移动应用实战》连载五(使用PhoneGap获取设备信息)

除了能够将HTML页面打包成可以直接安装运行的APP外,PhoneGap的一个最大优势在于可以通过JavaScript调用设备来访问设备上的硬件信息,从而实现一些原本只有依靠原生SDK才能够达到的目的.范例5-1就展示了一个利用API来获取设备信息的例子. [范例5-1 利用PhoneGap获取设备信息] <!DOCTYPE html> <html> <meta http-equiv="Content-Type" content="text/ht

小白学jquery Mobile《构建跨平台APP:jQuery Mobile移动应用实战》连载五(给button加图标)

在范例5-4所使用的导航栏中,已经为button增加了图标的样式,可是当时并没有介绍button的图标到底是怎么一回事.以下截取范例5-4中导航栏部分的代码: <divdata-role="footer"> <div data-role="navbar"data-grid="c"> <ul> <li><a id="chat" href="#"data-i

【原创】小白学jquery Mobile《构建跨平台APP:jQuery Mobile移动应用实战》连载五(给按钮加图标)

在范例5-4所使用的导航栏中,已经为按钮加入了图标的样式,但是当时并没有介绍按钮的图标究竟是怎么一回事.下面截取范例5-4中导航栏部分的代码: 1 <divdata-role="footer"> 2 <div data-role="navbar"data-grid="c"> 3 <ul> 4 <li><a id="chat" href="#"data-i

jquery Mobile应用第2课《构建跨平台APP:jQuery Mobile移动应用实战》连载二(简单的QWER键盘)

在jQuery Mobile的布局中,控件大多都是单独占据页面中的一行,按钮自然也不例外,但是仍然有一些方法能够让多个按钮组成一行,比如说在范例6-5中就利用按钮分组的方法使4个按钮并列在一行中,如图6-24和图6-25所示. 图6-24 实现按钮分组的方法 图6-25 分组的按钮 而在上一节中也许有读者已经注意到,头部栏中的按钮并没有占据一整行,也没有与多个按钮一起成组存在,那么在页面的其他部分是否也可以让按钮以这样的形式出现呢? [范例6-9 简单的QWER键盘] 01 <!DOCTYPE