安装Cloudera Impala

安装Cloudera Impala

Cloudera Impala是Cloudera Enterprise Core的开源扩展,用于快速返回查询结果。

Impala作为你环境的插件,与其他组件的安装独立进行。Impala由一组组件组成,可以安装到集群中的多个节点。

Impala包安装一下二进制文件:

  • impalad - Impala守护进程。解析并执行针对HDFS、HBase上数据的查询。集群中每一个数据节点上都要运行一个该进程。
  • statestored - 名称服务,跟踪集群中的所有impalad实例的位置和状态。集群中的一个节点上运行这个守护进程的一个实例。
  • catalogd - 元数据协调服务,用于广播Impala中DDL、DML语句导致的元数据变化到所有Impala节点,因此新建表、新载入数据、等等操作对于任意节点提交的查询都可见(Impala 1.2之前,你必须在每个节点上执行 REFRESHINVALIDATE METADATA 语句以同步元数据的更新。现在只需要在Hive中执行DDL、DML语句之后再执行这些语句)。
  • impala-shell - 连接Impala守护进程的执行查询的命令行接口。你可以在集群中一个或多个节点安装,但不需要是数据节点。它可以连接到远程的Impala守护进程。

在进行安装之前,请先确认满足所有的前提条件。参见Cloudera Impala需求了解详细信息。

有两种方式安装Impala:

  • 使用Cloudera Manager安装程序,参见使用Cloudera Manager安装Impala。这是执行可靠、可验证的方式安装Impala的推荐方式。Cloudera Manager 4.8以上版本可以自动安装、配置、管理和监控Impala 1.2.1以上版本。
  • 手工安装,参见不使用Cloudera Manager安装Impala。这时你必须做一些额外的验证步骤,用来检查Impala可以与其他Hadoop组件正确的交互,并且你的集群已经针对Impala高效执行正确的进行了配置。
时间: 2024-10-10 20:18:25

安装Cloudera Impala的相关文章

Cloudera Impala需求

Cloudera Impala需求 为了达到预期的效果,Impala依赖于软件.硬件的可用性,以及下面章节描述的配置. 继续阅读: 支持的操作系统 支持的Hadoop发布 Hive Metastore及相关配置 Java依赖关系 包和库 网络配置需求 硬件需求 用户帐户需求 支持的操作系统 支持的64位操作系统: Red Hat Enterprise Linux (RHEL) 5.7/6.2/6.4.Oracle Linux 5.7/6.2/6.4.Centos 5.7/6.2/6.4 在Red

cloudera impala编译 安装 配置 启动

无论是采用GDB调试impala或者尝试修改impala源码,前提都是需要本地环境编译impala,这篇文章详细的分享一下impala编译方法以及编译过程遇到的棘手的问题: 前言: impala官方的git上其实是有impala编译的步骤的,但是在后来的git版本迭代中,被藏在了一个诡异的地方,https://github.com/cloudera/Impala/tree/v1.2.2,虽i然官方给出了步骤,但该博文并不是官方的一个简单翻译,其中涵盖了很多我加入的细节提醒和遇到的bug以及错误的

Cloudera impala简介及安装详解

一.Impala简介 Cloudera Impala对你存储在Apache Hadoop在HDFS,HBase的数据提供直接查询互动的SQL.除了像Hive使用相同的统一存储平台,Impala也使用相同的元数据,SQL语法(Hive SQL),ODBC驱动程序和用户界面(Hue Beeswax).Impala还提供了一个熟悉的面向批量或实时查询和统一平台. 二.Impala安装 1.安装要求 (1)软件要求 Red Hat Enterprise Linux (RHEL)/CentOS 6.2 (

安装使用Cloudera Impala

安装与使用Cloudera Impala Cloudera Impala提供快速的.交互式的SQL查询方式,直接基于Apache Hadoop存储在HDFS或HBase中的数据进行查询.除了使用与Apache Hive相同的统一存储平台外,Impala也使用了与Hive相同的元数据.SQL语法(Hive SQL).ODBC驱动和用户接口(Cloudera Impala查询UI使用Hue).这样就提供了一个用于实时或批量的查询的熟悉的.统一的平台. Cloudera Impala是一个查询大数据的

Cloudera impala简单介绍及安装具体解释

一.Impala简单介绍 Cloudera Impala对你存储在Apache Hadoop在HDFS,HBase的数据提供直接查询互动的SQL.除了像Hive使用同样的统一存储平台,Impala也使用同样的元数据,SQL语法(Hive SQL),ODBC驱动程序和用户界面(Hue Beeswax).Impala还提供了一个熟悉的面向批量或实时查询和统一平台. 二.Impala安装 1.安装要求 (1)软件要求 Red Hat Enterprise Linux (RHEL)/CentOS 6.2

如何安装使用Impala

一.Impala简介 Cloudera Impala对你存储在Apache Hadoop在HDFS,HBase的数据提供直接查询互动的SQL.除了像Hive使用相同的统一存储平台,Impala也使用相同的元数据,SQL语法(Hive SQL),ODBC驱动程序和用户界面(Hue Beeswax).Impala还提供了一个熟悉的面向批量或实时查询和统一平台. 二.Impala安装1.安装要求(1)软件要求 Red Hat Enterprise Linux (RHEL)/CentOS 6.2 (64

离线安装Cloudera Manager 5和CDH5(最新版5.1.3) 完全教程

原文  http://www.cnblogs.com/jasondan/p/4011153.html 关于CDH和Cloudera Manager CDH (Cloudera's Distribution, including Apache Hadoop),是Hadoop众多分支中的一种,由Cloudera维护,基于稳定版本的Apache Hadoop构建,并集成了很多补丁,可直接用于生产环境. Cloudera Manager则是为了便于在集群中进行Hadoop等大数据处理相关的服务安装和监控

本地Yum软件源安装Cloudera Manager 5

本地Yum软件源安装Cloudera Manager 5 (非原创,转自http://blog.csdn.net/yangzhaohui168/article/details/30118175) Cloudera Manager 5(以下简称CM)默认采用在线安装的方式,给不能联互联网或者网络不畅的用户带来了不便,由于网络问题,屡装屡败的挫折感,让初次学习CDH用户真心体验到万事开头难.本文讲解了在CentOS 6环境下搭建本地Yum软件源,局域网内的用户在完全不连互联网的情况下,完成CM的安装

初识 Cloudera Impala

Impala是Cloudera公司主导开发的新型查询系统,它提供SQL语义,能查询存储在Hadoop的HDFS和HBase中的PB级大数据.已有的Hive系统虽然也提供了SQL语义,但由于Hive底层执行使用的是MapReduce引擎,仍然是一个批处理过程,难以满足查询的交互性.相比之下,Impala的最大特点也是最大卖点就是它的快速.Impala 为存储在 HDFS 和 HBase 中的数据提供了一个实时 SQL 查询接口. Impala优点 下图来自zdnet,描述了Impala的一些优点: