CentOS7.4到Elasticsearch一路坑(二)

终于开始hadoop

上来就手欠了一下,cp 了 *

现在我有一个问题:cp可不可以有进度反馈。。。

好了反正手欠也手欠了,还是在copy,好在我虚拟机配置的硬件参数够硬,沏杯茶的功夫也就完了,tar 解压hadoop

编辑hadoop-env.sh,把jdk路径写进去(我现在是偷懒,放在了根目录,另外还是要习惯一下,linux终端的复制是ctrl+shif+c,但是进入了gedit,还是ctrl+c)

编辑yarn-env.sh

编辑core-site.xml。。。行了我受够了vi和gedit了,上notepad++!

notepad++里ctrl+shift+alt+B,可以format一下xml,看起来就舒服多了,我不是处女座,没那么强烈的强迫症,但是不对齐就是看着没那么舒坦

好了舒坦了,继续hdfs-site.xml

yarn-ste.xml继续

计算框架mapred-site.xml只是一个模板,要copy一份

cp mapred-site.xml.template mapred-site.xml

最后一个,slaves,不截图了,就两个主机名

CentOS7Slave01
CentOS7Slave02

然后省事的部分来了,开始向slaves同步。。。

scp -r hadoop-2.7.3 CentOS7Slave01:~/

scp -r hadoop-2.7.3 CentOS7Slave02:~/

最后编辑一下环境变量(master和slaves都要编辑)

编辑完记得source一下

第一次启动,format一下namenode

sbin/start-all.sh

jps看一下

master启动了NameNode和ResourceManager

slave01启动了DataNode,NodeManger和SecondaryNameNode

slave02启动了DataNode,NodeManger

访问一下50070(本地还没配置hosts,用IP访问)

虚拟机上用hostanme

本来这个时候,Hadoop应该是告一段落,但是“应该”么。。。年轻人你想多了

事情是这样:format在我固化思维里,是比重启还好使的万能大法,只要硬盘不利索,我就直接format,但是hdfs的format,似乎不尽然,别忘了,人家hdfs的d可是Distributed,format的只是namenode,datanode还等着呢,在我手欠(对我又手欠了)又format了一遍namenode后,问题来了,集群datanode起不来了

看一下namenode文件夹(hadoop-2.7.3/name),会发现current下有一个VERSION,里面有clusterID

datanode(slave下的hadoop-2.7.3/data)下,current里也有一个VERSION

这两个本来是一样的,但是第二次format后,master下的namenode里clusterID变了,对不上了。。。

修改datanode里VERSION文件的clusterID 与namenode里的一致,再重新启动dfs(执行start-dfs.sh),datanode起来了

手欠有代价。。。

原文地址:https://www.cnblogs.com/ChristianKula/p/9357402.html

时间: 2024-10-24 23:08:49

CentOS7.4到Elasticsearch一路坑(二)的相关文章

CentOS7.4到Elasticsearch一路坑(一)

既然共享文件夹设置好了,直接去cp一下jdk,解压,编辑~/.bash_profile java就好了. 现在的问题是,CentOS7.X应该是换了防火墙,不是iptables,而且setup也大不一样,先不管那么多 systemctl disable firewalld 同步一下时钟 #crontab -e 输入0 1 * * * /usr/sbin/ntpdate us.pool.ntp.org #/usr/sbin/ntpdate us.pool.ntp.org 设置一下主机名 #gedi

CentOS7.4到Elasticsearch一路坑(十)

zeppelin 这个东西安装不是问题,稍微注意点的是,端口可能被占用,比如默认8080,但是我刚给了presto,所以要改一下,把zeppelin-site.xml.templete给cp一份,里面有端口 这个东西还挺智能,比如 好了安装完了,配置才是问题... 配置一下hive的interpreters downloading,等. 下载完,新建一个notebook 名字不重要,重要的是选择那个解释器 输入一个常规命令 去job里看 好了开始尝试hbase和elasticsearch,稍等-

CentOS7.4到Elasticsearch一路坑(五)

来来,zookeeper我们聊聊 zookeeper我是搭建了一个集群的,但是搭建完发现,bin/zkServer.sh status一直是不正常的 看了一下日志,的确有问题(有问题你还起来了?) 从这篇文章参考了一下:产生上述两条Waring信息是因为zookeeper服务的每个实例都拥有全局的配置信息,他们在启动的时候需要随时随地的进行leader选举,此时server1就需要和其他两个zookeeper实例进行通信,但是,另外两个zookeeper实例还没有启动起来,因此将会产生上述所示的

CentOS7 下安装 ElasticSearch 5.x 及填坑

ElasticSearch简介 什么是ElasticSearch: ElasticSearch是基于Apache Lucene构建的开源搜索引擎 采用Java编写,提供了简单易用的RESTFul API 轻松的横向扩展,可支持PB级的结构化或非结构化的数据处理 应用场景: 海量数据分析引擎 站内搜索引擎 作为数据仓库 一线公司实际应用场景: 英国卫报 - 实时分析公众对文章的回应 维基百科.GitHub - 站内实时搜索引擎 百度 - 实时日志监控平台 单实例安装ElasticSearch 在安

全栈一路坑(4)——创建博客的API

上一篇博客:全站之路一路坑(3)——使用百度站长工具提交站点地图 这一篇要搭建一个API平台,一是为了给博客补充一些功能,二是为以后做APP提供数据接口. 首先需要安装Django REST Framework的RESTful API库,记得先打开virtualenv,避免全局污染. pip install djangorestframework 然后添加到INSTALLED_APPS中 INSTALLED_APPS = [ 'django.contrib.admin', 'django.con

全站之路一路坑(2)——在Apache下部署django博客

上一篇博客:全栈之路一路坑之使用django开发博客 开发完博客之后,很多后续应用需要博客部署之后才可以使用,这篇文章就来尝试一下将开发好的博客部署到服务器上. 开发阶段,一直使用的是virtualenv和python manage.py runserver,但需要部署到服务器上时就有些不合适了,所以我尝试把它部署到Apache里. 查阅了相关资料发现部署方法有两种,一种是python_mod,另一种是wsgi,资料上说后者更加稳定一点,所以我选择使用wsgi进行集成. 安装httpd-deve

Centos7系统配置上的变化(二)网络管理基础

原文 Centos7系统配置上的变化(二)网络管理基础 上篇简单介绍了CentOS 7 在服务和网络方面的一点变化,先前很多烂熟于心的操作指令已经不适用了,不管是否习惯,总要接受.熟悉这些变化. 写上篇的时候还没有最小安装的ISO(CentOS-7.0-1406-x86_64-Minimal.iso),后来安装了首先发现ifconfig.netstat.route.arp都没有了,在哪儿呢? view sourceprint? 1.[root@centos7 ~]# yum search ifc

CentOS7与Windows AD集成之二Windows域账户登录CentOS7

上一节我们已经成功将CentOS7加入到Windows域控当中,那么我们是否可以用Windows的域账号直接登录加入域中的CentOS7呢?首先,我们在Windows域控当中新建一个测试账号:sshuser001打开putty,输入CentOS7的IP地址,尝试登录一下 可以看到,Windows的域账号可以成功登录到CentOS7:br/>这里需要注意一下登录时用户名的格式:[email protected] CentOS7与Windows AD集成之二Windows域账户登录CentOS7 原

python基础04/基础数据类型补充/以后会遇到的坑/二次编码

python基础04 内容大纲 基础数据类型补充 以后会遇到的坑 二次编码 1.基础数据类型补充 1.1 字符串(str) str: 不可变 1.1 首字母大写: # name = "alex" # name1 = name.capitalize() # print(name1) 1.2 每个单词首字母大写 # name = "alex wusir" # print(name.title()) 1.3 大小写反转 # name = "Alex"