虚拟机CentOs的安装及大数据的环境搭建

  大数据问题汇总
     1.安装问题
        1.安装步骤,详见文档《centos虚拟机安装指南》
        2.vi编辑器使用问题,详见文档《linux常用命令.pdf》
        3.网络中继更改问题
        命令:   vi /etc/sysconfig/network-scripts/ifcfg-eth0
·········需要修改的代码
·········DEVICE=eth0
            HWADDR=00:0C:29:11:02:E8
            TYPE=Ethernet
            UUID=c1038317-21f4-4251-a68f-0962fd644cab
            NBOOT=yes
            NM_CONTROLLED=yes
            BOOTPROTO=static
            IPADDR=192.168.17.238
            GATEWAY=192.168.17.1
            NDS1=114.114.114.114
            IPV6INIT=NO
      安装步骤到此结束
 2.hadoop 环境配置问题
           1.修改主机名称
               命令:vi /etc/hosts
           2.配置java ,hadoop环境变量
              命令:vi/etc/prifile
#java
JAVA_HOME=/jdk1.7.0_79
JAVA_BIN=/jdk1.7.0_79/bin
PATH=$JAVA_HOME/bin:$PATH
CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
export JAVA_HOME JAVA_BIN PATH CLASSPATH
#hadoop
export HADOOP_HOME=/home/hadoop-2.5.2
export PATH=$HADOOP_HOME/bin:$PATH
export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native
export HADOOP_OPTS="-Djava.library.path=$HADOOP_HOME/lib"
export JAVA_LIBRARY_PATH=/home/hadoop-2.5.2/lib/native/
         生效     命令:. /etc/prifile
        3关闭放火枪
           service iptables stop
           chkconfig iptables off
           3.1修改配置文件
           vi  /etc/selinux/config
                   修改为:
                     SELINUX=disabled

4.ssh免密设置
         下载 ssh服务
            命令:yum -y install openssh-clients
         生成ssh密匙:
            ssh-keygen -t rsa
        进入根目录:命令: cd~;
         cd .ssh
          ls 查看文件
         将文件  id_rsa.hub 考入: 命令:cat id_rsa.pub  >>authorized_keys
         将 datanode节点上的 id_rsa.hub 考入 命令
         ssh datanode1 cat .ssh/id_rsa.pub >>authorized_keys
        将文件发送到datanode节点:   
                    [[email protected] ~]# scp authorized_keys datanode1:~/.ssh
       测试 ssh datanode1 免密登陆到datanode1主机
       至此 前期配置完成
         5 hadoop配置
         修改hadoop配置文件
         yarn-site.xml
         mapred-site.xml
         slaves hdfs-site.xml
         yarn-env.sh
         hadoop-env.sh
       详见《hadoop配置手册》
      配置环境测试:
               cd /home/hadoop-2.5.2/sbin
             输入 sh start-all.sh
            等待启动
           启动完毕后
       测试:
              输入 jps
                namenode 节点 显示:
                      8722 ResourceManager
                       11446 Jps
                        9371 DataNode
                       8812 NodeManager
                        9283 NameNode
              datanode1节点 输入 jps
                        显示:
                    5694 Jps
                    2867 NodeManager
                    2782 DataNode
             则基本配置成功
            测试计算 pi
       cd /home/hadoop-2.5.2/share/hadoop/mapreduce   
          命令  [[email protected] mapreduce]# hadoop jar hadoop-mapreduce-examples-2.5.2.jar pi 2 5   
          回车

时间: 2024-10-14 01:41:13

虚拟机CentOs的安装及大数据的环境搭建的相关文章

大数据学习环境搭建(CentOS6.9+Hadoop2.7.3+Hive1.2.1+Hbase1.3.1+Spark2.1.1)

node1 192.168.1.11 node2 192.168.1.12 node3 192.168.1.13 备注 NameNode Hadoop Y Y 高可用 DateNode Y Y Y ResourceManager Y Y 高可用 NodeManager Y Y Y JournalNodes Y Y Y 奇数个,至少3个节点 ZKFC(DFSZKFailoverController) Y Y 有namenode的地方就有ZKFC QuorumPeerMain Zookeeper Y

cdh大数据平台环境搭建片

环境准备 三台服务器(由于我是学习环境,所以三台服务器不属于同一内网),配置如下: 公网ip 119.29.186.83   内网ip 10.104.157.113 公网ip 119.29.250.47   内网ip 10.104.9.181 公网ip 119.29.251.99   内网ip 10.104.196.48 软件包下载: http://archive.cloudera.com/cdh5/cdh/5/  下载地址 下载的文件名: 1.hadoop-2.6.0-cdh5.8.0.tar

大数据伪分布式搭建

大数据伪分布式搭建 ***对于大数据这块相信大家对linux有一定的认识,所有对创建虚拟机那块就不给予详细的说明了. 基础环境的搭建 1.系统环境 平台:VMware Workstation pro 系统:centos 7 Hadoop版本: Apache Hadoop 3.0.0 本次实验是搭建一台master和两台node节点.因为我们主要的目的是想让大家了解一下Hadoop伪分布式的搭建流程,如果说大家的电脑小于8G的话,那就每台节点就大概开个1.5G左右,也是为了大家有一个好的体验. 修

Ambari——大数据平台的搭建利器之进阶篇

前言 本文适合已经初步了解 Ambari 的读者.对 Ambari 的基础知识,以及 Ambari 的安装步骤还不清楚的读者,可以先阅读基础篇文章<Ambari--大数据平台的搭建利器>. Ambari 的现状 目前 Apache Ambari 的最高版本是 2.0.1,最高的 Stack 版本是 HDP 2.2.未来不久将会发布 Ambari 2.1 以及 HDP 2.3(本文也将以 Ambari 2.0.1 和 HDP 2.2 为例进行讲解).其实在 Ambari trunk 的 code

ELK 7.4.1 安装配置手册之前期环境搭建

ELK 7.4.1 安装配置手册之前期环境搭建 一. openjdk安装 1.说明 因为elasticsearch 7.4.1 需要依赖于java 11或以上的版本才可以运行,所以此处选择直接使用openjdk-13.0.1 的版本进行安装 . 本章主要介绍openjdk 的环境搭建 jdk下载链接: https://pan.baidu.com/s/1ZRPFSSTvsk2n4s8KzrLF8A 提取码:ll43 2.安装 解压openjdk[[email protected] ~]# tar

Linux虚拟机安装(大数据预科01)

Linux虚拟机安装 使用的工具及软件版本:Windows:win10家庭版(推荐使用专业版)虚拟机软件:VirtualBox v6.0Linux版本:CentOS 7 安装步骤: (1) 打开VirtualBox,点击新建(2)点击专家模式安装,完成选项后,点击创建(3) 文件大小给到50G(足够用了),其他的默认,点击创建(4)这时候就生成了一个空壳虚拟机,接下来进行内部配置(刚才就是分配了以下空间)------选中右击,点击设置(5)设置中修改以下几点,其他保持默认设置:---a---系统

开发人员学Linux(14):CentOS7安装配置大数据平台Hadoop2.9.0

1.前言 "大云物移"是当年很火热的一个话题,分别指大数据.云计算.物联网和移动互联网,其中大数据领域谈论得多就是Hadoop.当然Hadoop不代表大数据,而是大数据处理领域的一个比较有名的开源框架而已,通常说的大数据包含了大数据的存放.大数据的分析处理及大数据的查询展示,本篇提到的Hadoop只不过是在其中的大数据的分析处理环节起作用,Apache提供了一个开源全家桶,包括了Hadoop.HBase.Zookeeper.Spark.Hive及Pig等一些框架.不过限于篇幅,本篇只介

大数据之环境准备系列 ——第二篇 新装VMware 虚拟机 网络配置(NAT模式)

新安装虚拟机,需要配置网络环境,才可以使用ssh客户端(如xshell)远程登录 和 虚拟机访问Internet. 一. WMware 软件配置 WMware版本号:11.0.0 build-2305329 1  进入虚拟网络配置界面 菜单栏,点击编辑,之后点击 虚拟网络配置器(N),进入虚拟网络配置界面 2 配置NAT网卡 (1)从上部列表选择 类型为NAT 模式的虚拟网卡 (2)VMnet信息 部分 点击 NAT 设置,设置网关IP (3)配置虚拟网络编辑窗口其他内容,子网IP 和 子网掩码

大数据平台CDH搭建学习(5.10.0)

又是一个周末,本来是已经打开wegame,更新一下许久未碰的lol,后来实在等不下去了,还是想想写写博客,正好最近也在学习CDH:刚刚就像女生买东西一样,毫不犹豫地买了3个云主机,好了,废话不多说,下面我们正式开始CDH搭建大数据平台. 一.Hadoop是什么? Hadoop是一个分布式系统架构,由Apache基金会开发.用户可以在不理解分布式底层细节的情况下,开发分布式程序,充分利用集群的威力高速运算和存储. 不足之处:①版本管理混乱 ②部署过程繁琐,升级过程复杂 ③兼容性差 ④安全性低 二.