hadoop伪分布下的sqoop基本安装配置

1.环境工具版本介绍

centos6.4(Final)

jdk-7u60-linux-i586.gz

hadoop-1.1.2.tar.gz

sqoop-1.4.3.bin__hadoop-1.0.0.tar.gz

mysql-5.6.11.tar.gz

2.安装centos

参照网上Ultra的使用制作了U盘启动,直接格式化安装系统,具体做法网上资料很多,但注意最好不要在安装时改主机名称,也最好不要利用图形化界面添加用户,因为我出过问题重做了系统,这些terminal中都能完成的

3.安装jdk

安装好的centos中会有jdk的运行环境,需要先卸载它,因为它只带了jre环境,由于需要进行调试编译还是安装上jdk比较好,rpm -qa|grep jdk,查看已经安装的jdk版本,然后用命令将其卸载,注意机器需要联网,先配一下IP,    yum -y remove jdk 版本名称,将其卸载,然后进行jdk安装,这里采用解压的方式进行安装,还有一种是编译安装,就是文件中带有bin字样的包是编译安装的,这里直接解压就可以,我采用以下目录结构,如以下环境变量中所示,解压完成后放到/usr/java中,需要配置环境变量,vim /etc/profile

export JAVA_HOME=/usr/java/jdk1.7.0_60

export JRE_HOME=/usr/java/jdk1.7.0_60

export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib

export PATH=$PATH:$JAVA_HOME/bin:JRE_HOME/bin

然后Esc,保存退出

source /etc/profile

java -version

出现java版本,则说明jdk配置成功

4.hadoop安装

在此之前需要确保机器已经安装ssh协议,rpm -qa|grep ssh

若有信息显示ssh等,说明机器里有ssh,否则需要安装,同样联网情况下yum命令进行安装,yum -y install ssh

然后新建hadoop用户(这里名字你随意),groupadd hadoop,useradd -g hadoop hadoop(将hadoop添加到hadoop组中),然后切换hadoop用户,可以在sudoers中为hadoop添加sudo的权限,这里需要注意一下sudoers文件的访问权限,改完之后要重新改回去,在root    ALL=(ALL)    ALL下面添加hadoop    ALL=(ALL)    ALL,哦忘记提醒了,安装centos时最好采用English版进行安装,这样可能会带来许多方便,(你试了就知道了),su - hadoop。

然后配置无密码登录,由于是伪分布,就在本电脑上配置了,sudo service sshd restart,ssh-keygen -t rsa -P ‘‘

回车again

然后生成的文件默认保存到了/home/hadoop/.ssh/中,然后cd /home/hadoop/.ssh

cat id_rsa.pub>>authorized_keys,(相关信息可以到/etc/ssh/sshd_config中查看),然后就可以完成无密码登录了,重启一下ssh服务,然后ssh localhost

即可无密码登录成功了!

接下来安装hadoop,首先也是解压,然后放到/usr/local/hadoop中,然后需要进行一系列的文件的配置,需要配置环境变量,hadoop-env.sh,core-site.xml,hdfs-site.xml,mapred-site.xml,配置信息就不在多说了,要注意配置完后要将hadoop文件夹的权限给到hadoop用户,sudo chown -R hadoop:hadoop /usr/local/hadoop/,然后source /etc/profile,hadoop namenode -format,进行首次格式化,不要事先建好tmp,name,data等文件路径,系统会自动创建,否则会导致节点启动异常,然后进行启动,start-all.sh,jps命令查看启动几点,一共应该是5个加jps共6个

namenode

datanode

jobtracker

tasktracker

sencondnamenode

jps

过程中出现过无数次的错误,其中可以确定的如果datanode没起来,很有可能是因为你格式化多次导致的版本号对应不上的问题具体解决办法:进入hadoop/data/current/,vim VERSION,其中的namespaceID,查看一下是否与name中的一致,如不一致请改成一致的,然后重新启动集群,不用格式化,尽量避免多次格式化,集群启动成功后可以运行一下自身带的例子。

5.mysql的安装

在这里介绍一个好的博客,本人就是他的安装完成的,实现需要yum 安装一些编译工具,centosmysqlInstall

6.sqoop安装

同样先解压,放到/usr/local/sqoop中,然后配置环境变量,然后查看是否配置成功sqoop version,然后进行相关的必须的配置,sqoop依赖hadoop中的hadoop-core.jar和mysql的连接jar包,均放到sqoop/lib中,然后需要改sqoop的配置文件如附件中所示:首先hadoop需要启动,然后进行mysql导入hdfs的操作,sqoop import --connect mysql://localhost:3306/databaseName --table tableName --username userName --password passWord -m 1,默认则导入到hdfs中去,以后可以配置hbase,hive等,然后查看导入情况:hadoop fs -cat /user/hadoop/test/part-m-00000,如导入过程出现问题,如果是因为版本的问题会提示MethodNotFoundExecption异常,若是别的异常则可以通过修改hdfs配置文件来解决,我就是这么解决的,然后好用了

在hdfs-site.xml中加入两个property属性,一个是安全问题,一个是权限问题

<name>dfs.permissions</name><value>false</value>

<name>dfs.safemode.threshold.pct</name><value>0</value>

此文是事后才开始写的,所以可能会有问题,如有不清楚的伙伴可以Q我,374492359

hadoop伪分布下的sqoop基本安装配置

时间: 2024-12-09 08:43:14

hadoop伪分布下的sqoop基本安装配置的相关文章

Hadoop-1.2.1伪分布下 hive-0.10.0内嵌模式安装

Hadoop-1.2.1伪分布下 hive-0.10.0内嵌模式安装 1.下载hive-0.10.0 网址是:http://archive.apache.org/dist/hive/hive-0.10.0/   下载的安装包为:hive-0.10.0.tar.gz   2012-12-18 23:21  35M  2.把hive-0.10.0拷进 /usr/ 目录下,并进行解压 tar  –zxvf hive-0.10.0.tar.gz 解压完毕如下图: 3.修改文件名.修改hive文件权限.删

Hadoop伪分布安装详解+MapReduce运行原理+基于MapReduce的KNN算法实现

本篇博客将围绕Hadoop伪分布安装+MapReduce运行原理+基于MapReduce的KNN算法实现这三个方面进行叙述. (一)Hadoop伪分布安装 1.简述Hadoop的安装模式中–伪分布模式与集群模式的区别与联系. Hadoop的安装方式有三种:本地模式,伪分布模式,集群(分布)模式,其中后两种模式为重点,有意义 伪分布:如果Hadoop对应的Java进程都运行在一个物理机器上,称为伪分布 分布:如果Hadoop对应的Java进程运行在多台物理机器上,称为分布.[集群就是有主有从] 伪

Hadoop伪分布环境搭建——Linux环境配置

hadoop最近可以说是相当火,也勾起了我的兴趣,所以打算学习一下.想要学习hadoop肯定要先学会在自己的电脑上搭建一个hadoop伪分布环境.伪分布模式安装步骤的第一步就是要配置Linux环境.我自己的Linux是Ubuntu系统,不过只要是Linux系统,都大同小异,配置步骤基本没啥区别. 首先,需要进行本地网络配置.我们需要在linux系统下新增一个网络连接,自己设定好ip(ipv4)地址,子网掩码和网官.下图是我的设置: 接下来,还需要在window本地连接上也设置windows下的i

hadoop学习;hadoop伪分布搭建

先前已经做了准备工作安装jdk什么的,下面开始ssh免密码登陆,这里我们用的是PieTTY工具,当然你也可以直接在linux下直接操作 ssh(secure shell),执行命令 ssh-keygen -t rsa产生密钥,位于~/.ssh文件夹中 \ 一路enter 复制为文件authorized_keys 登陆成功和退出 接下来传输jdk和hadoop文件,这里用的工具是WinScp(类似ftp上传工具),有的虚拟机可以设置直接从物理机拖拽,我这放到/root/Downloads下 然后复

Ubuntu 下ftp服务器的安装配置

Ubuntu 下ftp服务器的安装配置 FTP服务器是平时应用最为广泛的服务之一.VSFTP是Very Secure FTP的缩写,意指非常安全的FTP服务.VSFTP功能强大,通过结合本地系统的用户认证模块及其多功能的配置项目,可以快速有效的搭建强大的多用户FTP服务. 首先我们考虑搭建FTP服务需要关注的都有哪些方面?比如我们最经常关注的有: 1.如何添加FTP用户?  2.如何临时冻结某FTP用户?  3.FTP用户登入后的默认目录?是否可以改变?  4.如何锁定FTP用户可访问的目录范围

Linux系统下JDK和Tomcat安装配置

Linux系统下JDK安装配置 1. 从oracle网站下载需要的JDK软件 :jdk-6u39-linux-i586.bin http://www.oracle.com/technetwork/java/javase/archive-139210.html 然后通过FTP上传到linux服务器上. 2. 将文件copy到/usr目录下 [[email protected] wendy]# cp jdk-6u39-linux-i586.bin /usr/ 3. 给文件添加执行权限: [[emai

Centos6.3下Ganglia3.6.0安装配置

最近安装Ganglia,由于之前Linux基础基本为0,因此费了很大的周折.最后在失败了好多次之后终于看到了梦寐以求的web界面.下面总结下这几天来的工作. ganglia是一个监控软件,他包含三部分:Gmond,Gmetad和Gweb.在需要监控的主机上安装Gmond,他会采集当前主机上的一些信息:Gmetad部署在服务器端,它轮训主机,收集Gmond采集的主机信息,然后存在在rrdtool数据库中:Gweb是一个前台显示的界面,他读取Gmetad保存的rrd文件,显示在web界面上. 部署规

Android NDK r8 Cygwin CDT 在window下开发环境搭建 安装配置与使用 详细图文讲解

android 最新 NDK r8 在window下开发环境搭建 安装配置与使用 详细图文讲解,完整实际配置过程记录(原创) 一直想搞NDK开发却一直给其他事情耽搁了,参考了些网上的资料今天终于把环境搭建起来了,把过程记录下来分享给大家. 内容目录: 1.默认基础环境 2.NDK下载与配置 3.安装Cygwin 4.用NDK编译 5.安装CDT插件 6.安装Sequoyah插件 7.JNI编译环境配置 画了一个思维导图让大家一目了然配置过程 ---------------------------

【转】android 最新 NDK r8 在window下开发环境搭建 安装配置与使用 详细图文讲解,完整实际配置过程记录(原创)

原文网址:http://www.cnblogs.com/zdz8207/archive/2012/11/27/android-ndk-install.html android 最新 NDK r8 在window下开发环境搭建 安装配置与使用 详细图文讲解,完整实际配置过程记录(原创) 一直想搞NDK开发却一直给其他事情耽搁了,参考了些网上的资料今天终于把环境搭建起来了,把过程记录下来分享给大家. 内容目录: 1.默认基础环境 2.NDK下载与配置 3.安装Cygwin 4.用NDK编译 5.安装