Centos7+hadoop2.7.3+jdk1.8

修改主机名

1. 修改主机名 vi /etc/sysconfig/network ,改为 master , slave1 , slave2

2. source /etc/sysconfig/network 让刚才的设置生效

3. 如果不行需要 reboot

4. 在master主机上输入命令:vi /etc/hosts,添加ip地址和主机名

设置host

5. 将修改后的host文件发送到其他主机,进行远程拷贝

scp /etc/hosts [email protected]:/etc

6. 设置免密码登录

　　a) ssh-keygen 生成密匙对

　　b) ssh-copy-id 其他主机(例如:ssh-copy-id slave1)

　 i. master-->slave1,slave2,master

　　 ii. slave1-->slave1,slave2,master

　　 iii. slave2-->slave1,slave2,master

安装jdk

1. 查看之间是否安装jdk

　　a) rpm –qa | grep jdk

2. 输入 rpm -e –nodeps 要卸载的软件

3. 安装包如下 在/opt/software/java 下进行解压 tar -xvf

4. 配置环境变量 在/etc/profile下

#set java environment
export JAVA_HOME=/opt/software/java/jdk1.8.0_141
export JRE_HOME=/opt/software/java/jdk1.8.0_141/jre
export CLASSPATH=.:$JRE_HOME/lib/rt.jar:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
export PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin

5. 重新加载配置文件source /etc/profile

6. 测试 java -version javac -version

安装hadoop

1. 在/opt/software/hadoop 目录下解压tar -xvf *** 安装包如下

2. 重命名 mv hadoop-2.7.3 hadoop

3. 在hadoop目录下创建目录tmp,logs,hdfs,hdfs/data,hdfs/name

4. 修改配置文件 etc/hadoop/hadoop-env.sh 文件中

etc/hadoop/yarn-env.sh中

5. etc/hadoop/slaves文件下删除原来的内容,加上从节点的名字

6. 配置 etc/hadoop/core-site.xml

<configuration>
<property>
                <name>fs.defaultFS</name>
                <value>hdfs://master:9000</value>
        </property>
        <property>
                <name>hadoop.tmp.dir</name>
                <value>file:/opt/software/hadoop/hadoop/tmp</value>
        </property>
        <property>
                <name>io.file.buffer.size</name>
                <value>131702</value>
        </property>
<property>
  <name>hadoop.proxyuser.root.hosts</name>
  <value>*</value>
</property>
<property>
  <name>hadoop.proxyuser.root.groups</name>
  <value>*</value>
</property>
</configuration>

配置 etc/hadoop/hdfs-site.xml

<configuration>

<property>

<name>dfs.namenode.name.dir</name>

<!--namenode节点数据存储目录-->

<value>file:/opt/software/hadoop/hadoop/hdfs/name</value>

</property>

<property>

<name>dfs.datanode.data.dir</name>

<!--datanode数据存储目录-->

<value>file:/opt/software/hadoop/hadoop/hdfs/data</value>

</property>

<property>

<!--指定DataNode存储block的副本数量,不大于DataNode的个数就行-->

<name>dfs.replication</name>

<value>2</value>

</property>

<property>

<!--指定master的http地址-->

<name>dfs.namenode.secondary.http-address</name>

<value>master:50090</value>

</property>

<property>

<!--指定master的https地址-->

<name>dfs.namenode.secondary.https-address</name>

<value>master:50091</value>

</property>

<property>

<!--必须设置为true，否则就不能通过web

访问hdfs上的文件信息-->

<name>dfs.webhdfs.enabled</name>

<value>true</value>

</property>

<property>

     <name>dfs.datanode.max.xcievers</name>

     <value>4096</value>

</property>

</configuration>

配置 etc/hadoop/yarn-site.xml 文件

<configuration>

<property>

<!--NodeManager上运行的附属服务。需配置成mapreduce_shuffle，才可运行MapReduce程序-->

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

<property>

<name>yarn.nodemanager.auxservices.mapreduce.shuffle.class</name>

<value>org.apache.hadoop.mapred.ShuffleHandler</value>

</property>

<property>

<!--ResourceManager 对客户端暴露的地址。客户端通过该地址向RM提交应用程序，杀死应用程序等。-->

<name>yarn.resourcemanager.address</name>

<value>master:8032</value>

</property>

<property>

<!--ResourceManager 对ApplicationMaster暴露的访问地址。ApplicationMaster通过该地址向RM申请资源、释放资源等。-->

<name>yarn.resourcemanager.scheduler.address</name>

<value>master:8030</value>

</property>

<property>

<!--ResourceManager 对NodeManager暴露的地址.。NodeManager通过该地址向RM汇报心跳，领取任务等。-->

<name>yarn.resourcemanager.resourcetracker.address</name>

<value>master:8031</value>

</property>

<property>

<!--ResourceManager 对管理员暴露的访问地址。管理员通过该地址向RM发送管理命令等。-->

<name>yarn.resourcemanager.admin.address</name>

<value>master:8033</value>

</property>

<property>

<!--用户可通过该地址在浏览器中查看集群各类信息。-->

<name>yarn.resourcemanager.webapp.address</name>

<value>master:8088</value>

</property>

<property>

<!--NodeManager总的可用物理内存。注意，该参数是不可修改的，一旦设置，整个运行过程中不可动态修改。另外，该参数的默认值是8192MB，因此，这个值通过一定要配置。不过，Apache已经正在尝试将该参数做成可动态修改的。-->

<name>yarn.nodemanager.resource.memory-mb</name>

<value>3072</value>

</property>

</configuration>

首先修改mapred-site.xml.default为mapred-site.xml

配置 etc/hadoop/mapred-site.xml

<configuration>

<property>

<name>mapreduce.framework.name</name>

<value>yarn</value>

</property>

<property>

<name>mapreduce.jobhistory.address</name>

<value>master:10020</value>

</property>

<property>

<name>mapreduce.jobhistory.webapp.address</name>

<value>master:19888</value>

</property>

</configuration>

7. 远程将master上的 /opt/SoftWare 的内容拷贝到子节点, -r 表示递归 scp -r /opt/SoftWare [email protected]:/opt/ scp -r /opt/SoftWare [email protected]:/opt/

8. 配置环境变量

export HADOOP_HOME=/opt/software/hadoop/hadoop

export HADOOP_LOG_DIR=$HADOOP_HOME/logs

export YARN_LOG_DIR=$HADOOP_LOG_DIR

export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH

9. 远程将master上的 /etc/profile 的内容拷贝到子节点

　　scp -r /etc/profile [email protected]:/etc/

10. 执行全部的source source /etc/profile

11. 同步系统时间

　　a) 安装ntpdate工具 yum -y install ntp ntpdate

　　b) 设置与网络时间同步ntpdate cn.pool.ntp.org

　　c) 系统时间写入硬件时间hwclock -systohc

12. 关闭防火墙

　　a) systemctl stop firewalld

　　b) 永久关闭(开机不自启)systemctl disable firewalld

13. 在主节点hadoop下格式化 bin/hdfs namenode -format

14. 启动集群 start-all.sh

时间： 2024-10-30 08:02:20

Centos7+hadoop2.7.3+jdk1.8的相关文章

Linux上安装Hadoop集群(CentOS7+hadoop-2.8.0)

1下载hadoop 2安装3个虚拟机并实现ssh免密码登录 2.1安装3个机器 2.2检查机器名称 2.3修改/etc/hosts文件 2.4 给3个机器生成秘钥文件 2.5 在hserver1上创建authorized_keys文件 2.6将authorized_keys文件复制到其他机器 2.7 测试使用ssh进行无密码登录 2.7.1在hserver1上进行测试 2.7.2在hserver2上进行测试 2.7.3在hserver3上进行测试 3安装jdk和hadoop 3.1安装JDK 3

CentOS7+hadoop2.6.4+spark-1.6.1

环境: CentOS7 hadoop2.6.4已安装两个节点:master.slave1 过程: 把下载的scala.spark压缩包拷贝到/usr/hadoop-2.6.4/thirdparty目录下. 安装scala: $ sudo tar -zxvf scala-2.11.8.tgz 修改环境变量文件 /etc/profile,添加以下内容: export SCALA_HOME=/usr/hadoop-2.6.4/thirdparty/scala-2.11.8 export PATH=$P

Linux基础环境_安装配置教程（CentOS7.2 64、JDK1.8、Tomcat8）

Linux基础环境_安装配置教程 (CentOS7.2 64.JDK1.8.Tomcat8) 安装包版本 1) VMawre-workstation版本包地址: https://my.vmware.com/web/vmware/details?downloadGroup=WKST-1411-WIN&productId=686&rPId=20814 包名:VMware-workstation-full-12.5.7.20721.exe 2) CentOS版本包地址:htt

CentOS7+Hadoop2.7.2(HA高可用+Federation联邦)+Hive1.2.1+Spark2.1.0 完全分布式集群安装

1 VM网络配置... 3 2 CentOS配置... 5 2.1 下载地址... 5 2.2 激活网卡... 5 2.3 SecureCRT. 5 2.4 修改主机名... 6 2.5 yum代理上网... 7 2.6 安装ifconfig. 8 2.7 wget安装与代理... 8 2.8

centos7中基于hadoop安装hive(CentOS7+hadoop2.8.0+hive2.1.1)

1下载hive 下载地址:http://hive.apache.org/downloads.html 点击上图的Download release now! 如图: 点击上图的某个下载地址,我点击的是国内的这个地址:http://mirror.bit.edu.cn/apache/hive/ 如图: 点击进入: apache-hive-2.1.1-bin.tar.gz 2安装 2.1上载和解压缩在opt目录下新建一个名为hive的目录,将apache-hive-2.1.1-bin.tar.gz拷贝

centos7 hadoop2.7.7 分布式环境搭建

一.安装准备(完整版带图片的找 [email protected]) 1.IP配置打开终端输入ifconfig查看网卡配置名字为 ens33 所以为本机为ifcfg-ens33(各个版本系统的名字不一样) 在ROOT下通过vim /etc/sysconfig/network-scripts/ifcfg-ens33进入界面再通过 I 进行文件修改将BOOTROTO 修改为 static (静态获取ip) 再添加网关,子网掩码,和dns解析服务器(有没有都行)和静态ip 在

CentOS7.2中安装JDK1.8.0_102+Tomcat9.0.0.M10

Tomcat是用来解析jsp程序的一个软件,Tomcat是Apache 软件基金会(Apache Software Foundation)的Jakarta项目中的一个核心项目,由Apache.Sun和其他一些公司及个人共同开发而成.因为Tomcat技术先进.性能稳定,而且免费,成为目前比较流行的Web 应用服务器. Tomcat是一个轻量级应用服务器,在中小型系统和并发访问用户不是很多的场合下被普遍使用,是开发和调试JSP程序的首选.实际上Tomcat 部分是Apache服务器的扩

linux（centos7）下安装jdk1.7

1. 删除linux系统自带的jdk 确定版本号 #java -version 查看自带的jdk: #rpm -qa | grep gcj 看到如下信息: libgcj-4.1.2-44.el5 java-1.4.2-gcj-compat-1.4.2.0-40jpp.115 使用rpm -e --nodeps 命令删除上面查找的内容: #rpm -e --nodeps java-1.4.2-gcj-compat-1.4.2.0-40jpp.115 2.源码包准备: 首先到官网下载jdk,htt

centos7.2.1511安装jdk1.8.0_151以及mysql5.6.38

一:环境二:下载jdk的rpm包到本地,上传到服务器(因为这块我刚开始使用wget直接下载到服务器,安装不断报错,所以我决定使用这种笨办法) 下载地址:http://download.oracle.com/otn-pub/java/jdk/8u151-b12/e758a0de34e24606bca991d704f6dcbf/jdk-8u151-linux-x64.rpm JDK默认安装在/usr/java中三:配置环境变量我的机器安装完jdk-8u151-linux-x64.rpm后不用配