Pig安装与配置

----------------------------------

一、前言

二、环境

三、配置

1.本地模式

2.MapReduce模式

四、测试

----------------------------------

一、前言

Pig是一个用来处理大规模数据集的平台,和Google的Sawzall类似,由Yahoo!贡献给Apache。MapReduce的查询矿街虽然主要是Map和Reduce两个函数,但是用户从编程写程序到在集群中部署、运行,仍然要花费不少时间。使用Pig可以简化MapReduce任务开发,提高控制具有上千台机器的Hadoop集群进行数据处理工作的方便程度。目前在Yahoo!有40%的MapReduce作业时通过Pig进行的。

Pig有两种工作模式:本地模式和MapReduce模式。

本地模式下,所有的文件和执行过程都在本机进行,本地模式可以在短时间内处理少量的数据,这样用户可以方便地进行程序功能的测试。输入“pig -x local”命令可以进入本地模式。MapReduce模式是用Pig进行实际工作的模式。

二、环境

系统:CentOS6.4 32位

软件包:pig-0.12.1.tar.gz

本实验均在上两篇博客基础上做。

本地模式及MapReduce模式均在master主机(192.168.2.101)上配置,master主机已安装hadoop集群。

三、配置

1.本地模式(root用户下配置)

# tar zxvf pig-0.12.1.tar.gz -C /usr/
# mv /usr/pig-0.12.1/ /usr/pig
# vim /etc/profile              //将pig的路径加入系统环境变量中
PIG_HOME=/usr/pig
PATH=$PATH:$PIG_HOME/bin
export PIG_HOME
# . /etc/profile
# jps                          //master主机进程
2822 JobTracker
2628 NameNode
5562 HMaster
2757 SecondaryNameNode
7865 Jps
# pig -x local                 //本地模式
2014-06-16 21:02:24,784 [main] INFO  org.apache.pig.Main - Apache Pig version 0.12.1 (r1585011) compiled Apr 05 2014, 01:41:34
2014-06-16 21:02:24,785 [main] INFO  org.apache.pig.Main - Logging error messages to: /usr/pig/pig_1402977744780.log
2014-06-16 21:02:24,855 [main] INFO  org.apache.pig.impl.util.Utils - Default bootup file /root/.pigbootup not found
2014-06-16 21:02:25,126 [main] INFO  org.apache.pig.backend.hadoop.executionengine.HExecutionEngine - Connecting to hadoop file system at: file:///
grunt>

2.MapReduce模式(root用户下配置)

# cd /usr/hadoop/
# tar cvf hadoop-conf.tar conf/      //将hadoop目录下的conf打包到pig下的conf目录
# cp hadoop-conf.tar /usr/pig/conf/
# cd /usr/pig/conf/
# tar xvf hadoop-conf.tar
# vim /etc/profile                   //将PIG_CLASSPATH加入到系统环境变量中
export PIG_CLASSPATH=/usr/pig/conf/conf
# . /etc/profile
# jps
2822 JobTracker
2628 NameNode
5562 HMaster
2757 SecondaryNameNode
7865 Jps
# pig                                //MapReduce模式
2014-06-16 21:33:01,054 [main] INFO  org.apache.pig.Main - Apache Pig version 0.12.1 (r1585011) compiled Apr 05 2014, 
2014-06-16 21:33:01,055 [main] INFO  org.apache.pig.Main - Logging error messages to: 
/usr/pig/conf/pig_1402979581052.log
2014-06-16 21:33:01,103 [main] INFO  org.apache.pig.impl.util.Utils - Default bootup file /root/.pigbootup not found
2014-06-16 21:33:01,541 [main] INFO  org.apache.pig.backend.hadoop.executionengine.HExecutionEngine - Connecting to 
2014-06-16 21:33:01,966 [main] INFO  org.apache.pig.backend.hadoop.executionengine.HExecutionEngine - Connecting to 
grunt>

四、测试

# pig
grunt> ls /usr/hadoop
hdfs://master:9000/usr/hadoop/tmp	<dir>
grunt> cd ..
grunt> ls
hdfs://master:9000/user/hadoop	<dir>
grunt> cd hadoop
grunt> ls
hdfs://master:9000/user/hadoop/out	<dir>
hdfs://master:9000/user/hadoop/test	<dir>
grunt> cd test
grunt> ls
hdfs://master:9000/user/hadoop/test/test1.txt<r 1>	11
hdfs://master:9000/user/hadoop/test/test2.txt<r 1>	13
grunt> cat test1.txt
hello word
grunt> copyToLocal test1.txt 1.txt   //复制hdfs系统的文件到本地
[[email protected] ~]# ll 1.txt            //在本地查看
-rwxrwxrwx. 1 root root 11 Jun 16 22:57 1.txt
grunt> sh jps                        //运行系统命令
2822 JobTracker
8700 RunJar
2628 NameNode
5562 HMaster
2757 SecondaryNameNode
9156 Jps

错误1:出现ERROR 2997: Encountered IOException.

grunt> ls 
2014-06-16 23:55:37,897 [main] ERROR org.apache.pig.tools.grunt.Grunt - ERROR 2997: Encountered IOException. File or directory null does not exist.
Details at logfile: /root/pig_1402984352164.log
grunt> ls /                         //加上/即可解决
hdfs://master:9000/user	<dir>
hdfs://master:9000/usr	<dir>
grunt> cd /user
grunt> ls
hdfs://master:9000/user/hadoop	<dir>
grunt> cd hadoop
grunt> ls
hdfs://master:9000/user/hadoop/out	<dir>
hdfs://master:9000/user/hadoop/test	<dir>

Pig安装与配置,布布扣,bubuko.com

时间: 2024-11-06 12:04:10

Pig安装与配置的相关文章

Pig安装及简单使用(pig版本0.13.0,Hadoop版本2.5.0)

原文地址:http://www.linuxidc.com/Linux/2014-03/99055.htm 我们用MapReduce进行数据分析.当业务比较复杂的时候,使用MapReduce将会是一个很复杂的事情,比如你需要对数据进行很多预处理或转换,以便能够适应MapReduce的处理模式,另一方面,编写MapReduce程序,发布及运行作业都将是一个比较耗时的事情. Pig的出现很好的弥补了这一不足.Pig能够让你专心于数据及业务本身,而不是纠结于数据的格式转换以及MapReduce程序的编写

Hadoop之Pig安装

Pig可以看做是Hadoop的客户端软件,使用Pig Latin语言可以实现排序.过滤.求和.分组等操作. Pig的安装步骤: 一.去Pig的官方网站下载.http://pig.apache.org/releases.html#14+April%2C+2014%3A+release+0.12.1+available 这里我选择的是14 October, 2013: release 0.12.0 available 这个版本.将pig-0.12.0.tar.gz 下载到本地中. 二.将Pig放在了

Pig安装讲解

Pig 简介: Pig 是 Apache 项目的一个子项目,Pig 提供了一个支持大规模数据分析的平台,Pig 突出的特点就是它的结构经得起大量并行任务的检验,使得它能够处理大规模数据集 Pig  特点: Pig 可简化 MapReduce 任务的开发 Pig 可以看做 Hadoop 的客户端软件,可以连接到 Hadoop 集群进行数据分析工作 Pig 方便不熟悉 Java 的用户,使用一种较为简便的类似 SQL 的面向数据流的语言 PigLatin 语言进行数据处理 PigLatin 可以进行

大数据平台HDP-2.6.4安装与配置

大数据平台HDP-2.6.4 安装 与配置 标签(空格分隔): 大数据平台构建 一: 关于HDP的介绍 二: 系统环境介绍 三: 系统环境初始化 四: 安装HDP-2.6.4平台 五: 启用NameNode HA 与 YARN HA 一:关于HDP的介绍 1.1:hdp 是什么 HDP全称叫做Hortonworks Data Platform. Hortonworks数据平台是一款基于Apache Hadoop的是开源数据平台,提供大数据云存储,大数据处理和分析等服务.该平台是专门用来应对多来源

Windows下MySQL下载安装、配置与使用

用过MySQL之后,不论容量的话,发现比其他两个(sql server .oracle)好用的多,一下子就喜欢上了.下面给那些还不知道怎么弄的童鞋们写下具体的方法步骤. (我这个写得有点太详细了,甚至有些繁琐,有很多步骤在其他的教程文档里都是省略掉的,但我还是要写出来,因为我当时走了很多弯路,我希望你们能够避免我走的这些弯路.当然,知道同学的可以略过,选择你想知道的地方看) 第一大步:下载.(不需要注册也可以下载,直接点下面的no thanks) a.俗话说:“巧妇难为无米之炊”嘛!我这里用的是

Centos 7.3下 Linux For SQL Server安装及配置介绍

Centos 7.3下Linux For SQL Server安装及配置介绍 说到SQL Server服务,我们大家都知道是Microsoft公司的数据库服务,当然说到数据库,现在主要分为三大商:1:Oracle.2:Msql Server.3:Mysql:三种数据库在当下环境受到不了不同程度的关注:比如oracle主要应用到大型的商业比较多,比如银行:SQL Server主要在常见的互联网公司使用:mysql主要应用于小型的企业或者服务商使用:当然从费用上来说,Oracle是最贵的,也是最为稳

redis的单机安装与配置以及生产环境启动方案

简单介绍一下redis的单机安装与配置,方便自己记录安装步骤的同时方便他人获取知识. 首先,从官网下载最新版的(稳定版)的redis安装包.官网地址如下:https://redis.io/download 下载源码包后,redis需要编译安装.需要安装gcc和tcl,gcc用于编译tcl用于测试. 使用命令安装gcc,yum install gcc,一路选择yes,gcc就可以安装成功. 接下来安装tcl,首先获取tcl源码包(见百度云盘)或者使用命令:wget http://downloads

Tomcat安装与配置

进行Tomcat的安装与配置,得要jdk的支持,jdk的安装与配置就不说了,毕竟学Java第一步就是这个,所以以下步骤是已有jdk的情况下进行的 首先进入Tomcat的官网http://tomcat.apache.org/,会出现左侧Download一栏,选择自己需要的Tomcat版本,这里我选择的是Tomcat 7 点击进入后到达如下界面,选择自己所对应的系统下载对应的zip包(个人感觉下载zip包简介一点,当然也可以下载可执行文件) 注意下载到哪个地方,下载完成后得到压缩包 对此压缩包进行解

MongoDB 3.2 在CentOS 上的安装和配置

MongoDB 3.2 在CentOS 上的安装和配置 2016-01-06 14:41:41 发布 您的评价:       0.0   收藏     0收藏 一.安装 编辑/etc/yum.repos.d/mongodb-org-3.2.repo [mongodb-org-3.2] name=MongoDB Repository baseurl=https://repo.mongodb.org/yum/redhat/$releasever/mongodb-org/3.2/x86_64/ gpg