hadoop伪分布模式搭建(下)

搭建伪分布式是在一台机器上模拟分布式部署,方便学习和调试。

1.解压hadoop文件

下载好的hadoop ,我们可以通过使用WinSCP 把压缩包软件把它 从宿主机复制移动到linux 的/usr/local 目录下。

解压缩文件,并重命名为hadoop,方便使用。重命名后这时,hadoop 目录的完整路径是“/usr/local/hadoop”

设置环境变量HADOOP_HOME,修改文件“/etc/profile”

修改环境变量后,执行source 命令,使配置立即生效。这里设置了一个别名cdha,可以快速转到hadoop 的目录。

hadoop 的目录结构:

着重关注bin目录和conf目录

2.修改配置文件

hadoop 配置文件默认是本地模式, 我们修改四个配置文件, 这些文件都位于$HADOOP_HOME/conf 目录下。

第一个是hadoop 环境变量脚本文件hadoop-env.sh。修改第9 行代码为

export  JAVA_HOME=/usr/local/jdk

保存并关闭。这里设置的是JAVA_HOME,注意去掉前面的“#”。

依次修改core-site.xml、hdfs-site.xml、mapred-site.xml。core-site.xml和hdfs-site.xml是站在hdfs角度上的,core-site.xml和mapred-site.xml是站在mapreduce角度上的。

core-site.xml:

<configuration>
  <property>
        <name>fs.default.name</name>
        <value>hdfs://hadoop:9000</value>
        <description>hdfs的访问路径</description>
    </property>
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/usr/local/hadoop/tmp</value>
	<description>hadoop 运行临时文件的目录</description>
    </property>
</configuration>

hdfs-site.xml:

<configuration>
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
    <description>存储副本数</description>
</configuration>

mapre-site.xml:

<configuration>
    <property>
        <name>mapred.job.tracker</name>
        <value>hadoop:9001</value>
        <description>jobtracker 的访问路径</description>
    </property>
</configuration>

3.运行hadoop

第一次使用hadoop 之前需要进行格式化。执行命令

$HADOOP_HOME/bin/hadoop namenode –format

注:hadoop格式化一次就好了,无需每次使用都要进行格式化操作。如果真的有必要再次格式化,先把“$HADOOP_HOME/tmp”目录下的文件全部删除。

启动hadoop 的命令为start-all.sh           启动后用jps检查进程是否启动成功,出现如下图所示一个进程都不少说明启动成功。

关闭hadoop 的命令为:stop-all.sh

hadoop 伪分布模式搭建完毕!

时间: 2024-08-25 07:27:12

hadoop伪分布模式搭建(下)的相关文章

hadoop 伪分布模式搭建(上)

软件: hadoop1.1.2.pietty(在windows系统下登录到linux虚拟机的远程登录软件).winscp(在本地与远程计算机间安全的复制文件).jdk-6u24-linux-i586.bin.virtualbox上安装的centos 系统(安装过程这里不说了) 安装步骤: 注:避免安装过程出现文件操作权限导致的问题,以下操作在root用户下进行. 1.安装ssh免密码登录 hadoop 运行过程需要远端管理hadoop 守护进程,linux 虚拟机没有ssh server,安装命

Spark教程-构建Spark集群-配置Hadoop伪分布模式并运行Wordcount示例(1)

第四步:配置Hadoop伪分布模式并运行Wordcount示例 伪分布模式主要涉及一下的配置信息: 修改Hadoop的核心配置文件core-site.xml,主要是配置HDFS的地址和端口号: 修改Hadoop中HDFS的配置文件hdfs-site.xml,主要是配置replication; 修改Hadoop的MapReduce的配置文件mapred-site.xml,主要是配置JobTracker的地址和端口: 在具体操作前我们先在Hadoop目录下创建几个文件夹: 下面开始构建具体的伪分布式

hadoop学习;hadoop伪分布搭建

先前已经做了准备工作安装jdk什么的,下面开始ssh免密码登陆,这里我们用的是PieTTY工具,当然你也可以直接在linux下直接操作 ssh(secure shell),执行命令 ssh-keygen -t rsa产生密钥,位于~/.ssh文件夹中 \ 一路enter 复制为文件authorized_keys 登陆成功和退出 接下来传输jdk和hadoop文件,这里用的工具是WinScp(类似ftp上传工具),有的虚拟机可以设置直接从物理机拖拽,我这放到/root/Downloads下 然后复

Hadoop伪分布模式操作

http://blog.csdn.net/wangloveall/article/details/20195813 摘要:本文介绍Hadoop伪分布模式操作,适合于Hadoop学习.开发和调试. 关键词:Hadoop    伪分布式   文件配置 启动Hadoop支持三种模式操作,分别是单机模式操作.伪分布模式操作和全分布模式操作. 单机模式操作是Hadoop的默认操作模式,当首次解压Hadoop的源码包时,Hadoop无法了解硬件安装环境,会保守地选择最小配置,即单机模式.该模式主要用于开发调

Hadoop伪分布模式的安装

Hadoop伪分布模式的安装 [环境参数] (1)Host OS:Win7 64bit (2)IDE:Eclipse Version: Luna Service Release 2 (4.4.2) (3)虚拟机:VMware 10 (4)Client OS:CentOS 6.4 32bit. 注意: 若是CentOS 64bit,则在启动hadoop时,会报出警告. 原因:Hadoop的本地库($HADOOP_HOME/lib/native/libhadoop.so.1.0.0)是在32 bit

3-2 Hadoop伪分布模式配置部署

Hadoop伪分布模式配置部署 一.实验介绍 1.1 实验内容 hadoop配置文件介绍及修改 hdfs格式化 启动hadoop进程,验证安装 1.2 实验知识点 hadoop核心配置文件 文件系统的格式化 测试WordCount程序 1.3 实验环境 hadoop2.7.6 CentOS6终端 1.4 适合人群 本课程难度为一般,属于初级级别课程,适合具有hadoop基础的用户. 1.5 相关文件 https://pan.baidu.com/s/1a_Pjl8uJ2d_-r1hbN05fWA

Hadoop - Hadoop伪分布式搭建

进行Hadoop伪分布式搭建时,需要有一定的Linux命令基础, 因为Hadoop是搭建在Linux环境上的开源框架, Hadoop的框架最核心的设计就是:HDFS和MapReduce. 本文也主要讲述HDFS和MapReduce环境的搭建. 搭建环境: 虚拟机: VMware10 操作系统:CentOS-6.5 JDK版本:jdk-8u171-linux-x64 Hadoop版本:hadoop-2.7.3 使用工具:Xshell 6,Xftp 6,Notepad++ 虚拟机ip地址:192.1

Hadoop伪分布模式环境搭建

最近开始研究学习hadoop,想把自己的一些知识点写在这里作为自己的学习记录.同时,如果能够为有需要的朋友带来帮助也是一件快乐的事.这篇文章基本上都是参考网上的资料,我按照自己的理解和实践经验将其组织起来.网上大多教程没有具体介绍操作的背后原因,我按照我的理解以及将一些分布于网上比较散乱的细碎知识点进行了组织.因为时间以及个人能力原因,本安装文档会存在很多不足,后期我也会努力去学习提高自己.我的博客园之旅就以此hadoop安装开始.因为时间原因,我第一次发博客,图片没有加上,不过文章基本描述清楚

Hadoop伪分布式搭建步骤

说明: 搭建环境是VMware10下用的是Linux CENTOS 32位,Hadoop:hadoop-2.4.1  JAVA :jdk7 32位:本文是本人在网络上收集的HADOOP系列视频所附带的课堂笔记(这里直接抄过来的,望原谅,我不是坏人),记录备忘. 开始前让我们简单修改下LINUX系统的JDK:一般情况下,我们都要将linux自带的OPENJDK卸载掉,然后安装SUN的JDK(下面的代码来源网络,请注意真实自己环境) <1> 查看已经安装的JAVA版本信息 # java -vers