《开源大数据分析引擎Impala实战》目录

当当网图书信息:

http://product.dangdang.com/23648533.html

第1章  Impala概述、安装与配置................................................................................ 1

1.1 Impala概述........................................................................................................................... 1

1.2 Cloudera Manager安装准备................................................................................................ 2

1.3  CM及CDH安装............................................................................................................... 10

1.4  Hive安装............................................................................................................................ 23

1.5 Impala安装......................................................................................................................... 26

第2章  Impala入门示例............................................................................................. 29

2.1  数据加载............................................................................................................................. 29

2.2  数据查询............................................................................................................................. 36

2.3  分区表................................................................................................................................. 37

2.4  外部分区表......................................................................................................................... 41

2.5  笛卡尔连接......................................................................................................................... 44

2.6  更新元数据......................................................................................................................... 45

第3章  Impala概念及架构......................................................................................... 47

3.1 Impala服务器组件............................................................................................................. 47

3.1.1 Impala Daemon....................................................................................................... 47

3.1.2 Impala Statestore.................................................................................................... 48

3.1.3 Impala Catalog........................................................................................................ 49

3.2 Impala应用编程................................................................................................................. 51

3.2.1 Impala SQL方言................................................................................................... 52

3.2.2 Impala编程接口概述............................................................................................ 52

3.3  与Hadoop生态系统集成.................................................................................................. 53

3.3.1 与Hive集成.......................................................................................................... 53

3.3.2 与HDFS集成........................................................................................................ 53

3.3.3 使用HBase............................................................................................................ 54

第4章  SQL语句....................................................................................................... 55

4.1  注释..................................................................................................................................... 55

4.2  数据类型............................................................................................................................. 56

4.2.1 BIGINT.................................................................................................................. 56

4.2.2 BOOLEAN............................................................................................................ 57

4.2.3 DOUBLE............................................................................................................... 58

4.2.4 FLOAT................................................................................................................... 59

4.2.5 INT......................................................................................................................... 59

4.2.6 REAL..................................................................................................................... 60

4.2.7 SMALLINT............................................................................................................ 60

4.2.8 STRING................................................................................................................. 61

4.2.9 TIMESTAMP......................................................................................................... 62

4.2.10 TINYINT.............................................................................................................. 66

4.3  常量..................................................................................................................................... 66

4.3.1 数值常量................................................................................................................ 66

4.3.2 字符串常量............................................................................................................ 67

4.3.3 布尔常量................................................................................................................ 67

4.3.4 时间戳常量............................................................................................................ 68

4.3.5  NULL..................................................................................................................... 68

4.4  SQL操作符........................................................................................................................ 70

4.4.1 BETWEEN 操作符............................................................................................... 70

4.4.2 比较操作符............................................................................................................ 71

4.4.3 IN操作符............................................................................................................... 72

4.4.4 IS NULL操作符................................................................................................... 72

4.4.5 LIKE操作符.......................................................................................................... 73

4.4.6 REGEXP操作符................................................................................................... 74

4.5  模式对象和对象名称......................................................................................................... 75

4.5.1 别名........................................................................................................................ 75

4.5.2 标示符.................................................................................................................... 76

4.5.3 数据库.................................................................................................................... 76

4.5.4 表............................................................................................................................ 77

4.5.5 视图........................................................................................................................ 78

4.5.6 函数........................................................................................................................ 83

4.6  SQL语句............................................................................................................................ 83

4.6.1  ALTER TABLE..................................................................................................... 84

4.6.2  ALTER VIEW....................................................................................................... 90

4.6.3 COMPUTE STATS................................................................................................ 92

4.6.4 CREATE DATABASE.......................................................................................... 95

4.6.5 CREATE FUNCTION........................................................................................... 96

4.6.6 CREATE TABLE.................................................................................................. 98

4.6.7 CREATE VIEW................................................................................................... 103

4.6.8 DESCRIBE.......................................................................................................... 104

4.6.9 DROP DATABASE............................................................................................ 106

4.6.10 DROP FUNCTION........................................................................................... 107

4.6.11 DROP TABLE................................................................................................... 107

4.6.12 DROP VIEW..................................................................................................... 108

4.6.13 EXPLAIN.......................................................................................................... 108

4.6.14 INSERT.............................................................................................................. 110

4.6.15 INVALIDATE METADATA........................................................................... 116

4.6.16 LOAD DATA.................................................................................................... 120

4.6.17 REFRESH.......................................................................................................... 124

4.6.18 SELECT............................................................................................................. 125

4.6.19 SHOW................................................................................................................ 143

4.6.20 USE.................................................................................................................... 147

4.7  内嵌函数........................................................................................................................... 148

4.7.1 数学函数.............................................................................................................. 150

4.7.2 类型转换函数...................................................................................................... 155

4.7.3 时间和日期函数.................................................................................................. 155

4.7.4 条件函数.............................................................................................................. 160

4.7.5 字符串函数.......................................................................................................... 161

4.7.6 特殊函数.............................................................................................................. 166

4.8  聚集函数........................................................................................................................... 167

4.8.1  AVG..................................................................................................................... 167

4.8.2 COUNT................................................................................................................ 168

4.8.3 GROUP_CONCAT............................................................................................. 169

4.8.4 MAX..................................................................................................................... 169

4.8.5 MIN...................................................................................................................... 170

4.8.6 NDV..................................................................................................................... 170

4.8.7 SUM..................................................................................................................... 171

4.9  用户自定义函数UDF...................................................................................................... 171

4.9.1 UDF概念............................................................................................................. 172

4.9.2 安装UDF开发包................................................................................................ 176

4.9.3 编写UDF............................................................................................................. 176

4.9.4 编写UDAF.......................................................................................................... 179

4.9.5 编译和部署UDF................................................................................................. 183

4.9.6 UDF性能............................................................................................................. 184

4.9.7 创建和使用UDF示例........................................................................................ 184

4.9.8 UDF 安全............................................................................................................ 193

4.9.9 Impala UDF的限制............................................................................................. 193

4.10 Impala SQL &Hive QL................................................................................................... 193

4.11  将SQL移植到Impala上.............................................................................................. 195

第5章  Impala shell................................................................................................. 201

5.1  命令行选项....................................................................................................................... 201

5.2  连接到Impalad................................................................................................................. 209

5.3  运行命令........................................................................................................................... 210

5.4  命令参考........................................................................................................................... 210

5.5  查询参数设置................................................................................................................... 211

第6章  Impala管理.................................................................................................. 228

6.1  准入控制和查询队列....................................................................................................... 228

6.1.1 准入控制概述...................................................................................................... 228

6.1.2 准入控制和YARN............................................................................................. 229

6.1.3 并发查询限制...................................................................................................... 229

6.1.4 准入控制和Impala客户端协同工作................................................................. 230

6.1.5 配置准入控制...................................................................................................... 230

6.1.6 使用准入控制指导原则...................................................................................... 236

6.2  使用YARN资源管理(CDH5)........................................................................................ 237

6.2.1 Llama进程........................................................................................................... 237

6.2.2 检查计算的资源和实际使用的资源.................................................................. 237

6.2.3 资源限制如何生效.............................................................................................. 238

6.2.4 启用Impala资源管理......................................................................................... 238

6.2.5 资源管理相关impala-shell参数......................................................................... 238

6.2.6 Impala资源管理的限制...................................................................................... 238

6.3  为进程,查询,会话设定超时限制............................................................................... 239

6.4  通过代理实现Impala高可用性...................................................................................... 240

6.5  管理磁盘空间................................................................................................................... 243

第7章  Impala存储.................................................................................................. 245

7.1  文件格式选择................................................................................................................... 245

7.2  Text.................................................................................................................................... 247

7.2.1 查询性能.............................................................................................................. 247

7.2.2 创建文本表.......................................................................................................... 248

7.2.3 数据文件.............................................................................................................. 249

7.2.4 加载数据.............................................................................................................. 249

7.2.5 LZO压缩............................................................................................................. 250

7.3 Parquet............................................................................................................................... 253

7.3.1 创建Parquet表.................................................................................................... 253

7.3.2 加载数据.............................................................................................................. 254

7.3.3 查询性能.............................................................................................................. 255

7.3.4 Snappy/Gzip压缩................................................................................................ 256

7.3.5 与其他组件交换Parquet数据文件.................................................................... 260

7.3.6  Parquet数据文件组织方式................................................................................. 260

7.4  Avro................................................................................................................................... 263

7.4.1 创建Avro表........................................................................................................ 263

7.4.2 使用Hive创建的Avro表.................................................................................. 265

7.4.3 通过JSON指定Avro模式................................................................................ 265

7.4.4 启用压缩.............................................................................................................. 265

7.4.5 模式进化.............................................................................................................. 266

7.5 RCFile................................................................................................................................ 268

7.5.1 创建RCFile表和加载数据................................................................................. 268

7.5.2 启用压缩.............................................................................................................. 269

7.6 SequenceFile...................................................................................................................... 270

7.6.1 创建和加载数据.................................................................................................. 270

7.6.2 启用压缩.............................................................................................................. 271

7.7 HBase................................................................................................................................ 272

7.7.1 支持的Hbase列类型.......................................................................................... 273

7.7.2 性能问题.............................................................................................................. 273

7.7.3 适用场景.............................................................................................................. 280

7.7.4 数据加载.............................................................................................................. 281

7.7.5 启用压缩.............................................................................................................. 281

7.7.6 限制...................................................................................................................... 282

7.7.7 示例...................................................................................................................... 282

第8章  Impala分区.................................................................................................. 284

8.1  分区技术适用场合........................................................................................................... 284

8.2  分区表相关SQL语句..................................................................................................... 285

8.3  分区修剪........................................................................................................................... 285

8.4  分区键列........................................................................................................................... 288

8.5  使用不同的文件格式....................................................................................................... 288

第9章  Impala性能优化........................................................................................... 290

9.1  最佳实践........................................................................................................................... 290

9.2  连接查询优化................................................................................................................... 291

9.3  使用统计信息................................................................................................................... 301

9.4  基准测试........................................................................................................................... 309

9.5  控制资源使用................................................................................................................... 309

9.6  性能测试........................................................................................................................... 310

9.7  使用EXPLAIN信息....................................................................................................... 311

9.8  使用PROFILE信息........................................................................................................ 312

第10章  Impala设计原则与应用案例....................................................................... 322

10.1  设计原则......................................................................................................................... 322

10.2  应用案例......................................................................................................................... 323

时间: 2024-10-14 00:01:25

《开源大数据分析引擎Impala实战》目录的相关文章

Effective Java 目录

<Effective Java>目录摘抄. 我知道这看起来很糟糕.当下,自己缺少实际操作,只能暂时摘抄下目录.随着,实践的增多,慢慢填充更多的示例. Chapter 2 Creating and Destroying Objects Consider static factory methods instead of constructors Consider a builder when faced with many constructor parameters Enforce the s

《Effective C++》 目录

目录 条款1:视C++为一个语言联邦 条款2:尽量以const.enum.inline替换#define 条款3:尽可能使用const 条款4:确定对象使用前已先被初始化 条款5:了解C++默认编写并调用哪些函数 条款6:若不想使用编译器自动生成的函数,就该明确拒绝 条款7:为多态基类声明virtual析构函数 条款8:别让异常逃离析构函数 条款9:绝不在构造和析构过程中调用virtual函数 条款10:令operator=返回一个reference to *this 条款11:在operato

《Effective C++》 目录:

目录 条款1:视C++为一个语言联邦 条款2:尽量以const.enum.inline替换#define 条款3:尽可能使用const 条款4:确定对象使用前已先被初始化 条款5:了解C++默认编写并调用哪些函数 条款6:若不想使用编译器自动生成的函数,就该明确拒绝 条款7:为多态基类声明virtual析构函数 条款8:别让异常逃离析构函数 条款9:绝不在构造和析构过程中调用virtual函数 条款10:令operator=返回一个reference to *this 条款11:在operato

Effective JavaScript: 编写高质量JavaScript代码的68个有效方法(目录)

本书赞誉译者序序前言第 1 章 让自己习惯 JavaScript 1第 1 条: 了解你使用的 JavaScript版本 1第 2 条:理解 JavaScript 的浮点数 6第 3 条:当心隐式的强制转换 8第 4 条:原始类型优于封装对象 13第 5 条: 避免对混合类型使用== 运算符 14第 6 条:了解分号插入的局限 16第 7 条: 视字符串为 16 位的代码单元序列 21第 2 章 变量作用域 25第 8 条:尽量少用全局对象 25第 9 条:始终声明局部变量 27第 10 条:避

reading notes —— effective Java;目录结构,便于复习与查找

第1章 引言 第2章 创建和销毁对象 第1条:考虑用静态工厂方法代替构造器 第2条:遇到多个构造器参数时要考虑用构建器 第3条:用私有构造器或者枚举类型强化Singleton属性 第4条:通过私有构造器强化不可实例化的能力 第5条:避免创建不必要的对象 第6条:消除过期的对象引用 第7条:避免使用终结函数 第3章 对于所有对象都通用的方法 第8条:改写equals时请遵守通用约定 第9条:改写equals时总要改写hashCode 第10条:始终要改写toString 第11条:谨慎地改写clo

文件查询之三:文件和目录的批量操作

经过之前两篇的随笔已经可以将所需要的文件和目录查找出来,并且保存在一个文档中,所以现在就是利用保存文件或目录的文档来进行批量处理,对文件或目录进行批量的 删除.复制和移动.主要是用到shutil模块中的函数和os模块中的函数进行一系列的操作.shutil模块存在大量的文件操作和目录操作的函数,包括常用的移动文件或复制文件 等操作,其中os和shutil下对于函数的功能存在交集,只不过相同功能下的函数名存在差异,函数上的细节处理方面也有可能不一样.在这里主要的是讲shutil模块下的函数. 首先是

[.NET] 《Effective C#》读书笔记(二)- .NET 资源托管

<Effective C#>读书笔记(二)- .NET 资源托管 简介 续 <Effective C#>读书笔记(一)- C# 语言习惯. .NET 中,GC 会帮助我们管理内存,我们并不需要去担心内存泄漏,资源分配和指针初始化等问题.不过,它也并非万能,因为非托管资源需要我们自己进行清理,如文件句柄.数据库连接.GDI+ 对象和COM 对象等. 目录 十二.推荐使用成员初始化器而不是赋值语句 十三.正确地初始化静态成员变量 十四.尽量减少重复的初始化逻辑 十五.使用 using

SQLite学习手册(目录)

Posted on 2012-03-09 07:36 Stephen_Liu 阅读(11956) 评论(22) 编辑 收藏 在实际的应用中,SQLite作为目前最为流行的开源嵌入式关系型数据库,在系统的架构设计中正在扮演着越来越为重要的角色.和很多其它嵌入式NoSQL数据库不同的是,SQLite支持很多关系型数据库的基本特征,这在数据移植.程序演示等应用中有着不可替代的优势.从官方文档中我们可以获悉到,SQLite支持的数据量和运行效率都是非常骄人的,因此在海量数据的解决方案中,SQLite可以

Notes for Apue &mdash;&mdash; chapter 4 Files and Directories(文件和目录)

4.1 Introduction 4.2 stat, fstat, fstatat, and lstat Functions The lstat function is similar to stat, but when the named file is a symbolic link, lstat returns information about the symbolic link, not the file referenced by the symbolic link. 4.3 文件类

我的第一本C++书,目录

共分三篇十三章.这是总目录,细分到节: 1 /* 2 3 我的第一本C++书(游历C++世界的地图) 4 5 第1篇 叩开c++世界的大门 6 7 8 第1章 c++世界地图 9 1.1 c++是什么 10 1.2 c++的前世今生 11 1.2.1 从b到c 12 1.2.2 从c到c++ 13 1.2.3 从c++到.net framework的cli 14 1.2.4 最新标准c++0x让c++重新焕发活力 15 1.2.5 c++和c#不得不说的那点事儿 16 1.2.6 c++世界的五