Storm分布式集群搭建

1、解压Storm压缩文件

[[email protected] software]# tar -zxf apache-storm-0.10.0.tar.gz -C /opt/modules
[[email protected] software]# cd /opt/modules
[[email protected] modules]# mv apache-storm-0.10.0 storm-0.10.0

2、配置Storm的配置文件

部署依赖环境

Java 6+
Python 2.6.6+

2.1、部署zookeeper

3.4.5+
ZK为什么要用3.4.5，因为它支持磁盘的快照和namenode的定期删除，
避免磁盘被打满

分发storm包

0.9.4+

2.2、配置storm

修改/opt/modules/storm-0.10.0/conf/目录下的storm.yaml配置文件

[[email protected] conf]# pwd
/opt/modules/storm-0.10.0/conf
[[email protected] conf]# vi storm.yaml

storm.zookeeper.servers:
     - "master"
     - "slave1"
     - "slave2"

nimbus.host: "master"

2.3、将在master主机配置文件目录发送给slave1、slave2

[[email protected] modules]# scp -r storm-0.10.0 [email protected]:/opt/modules/storm-0.10.0
[[email protected] modules]# scp -r storm-0.10.0 [email protected]:/opt/modules/storm-0.10.0

3、启动Storm

3.1、启动Zookeeper

/opt/modules/zookeeper/bin/zkServer.sh status
/opt/modules/zookeeper/bin/zkServer.sh start

3.2、启动niumbus

[[email protected] storm-0.10.0]# cd /opt/modules/storm-0.10.0
[[email protected] storm-0.10.0]# ./bin/storm nimbus >> logs/nimbus.out 2>&1 &

[[email protected] storm-0.10.0]# tail -f logs/nimbus.log

3.3、启动Storm Web UI

[[email protected] ~]# cd /opt/modules/storm-0.10.0
[[email protected] storm-0.10.0]# ./bin/storm ui >> logs/ui.out 2>&1 &

[[email protected] storm-0.10.0]# tail -f logs/ui.log

查看Storm Web UI

在浏览器地址栏中输入：http://192.168.230.129:8080

3.4、启动supervisor

启动master中的supervisor

[[email protected] ~]# cd /opt/modules/storm-0.10.0
[[email protected] storm-0.10.0]# ./bin/storm supervisor >> logs/supervisor.out 2>&1 &

[[email protected] storm-0.10.0]# tail -f logs/supervisor.log

启动slave1中的supervisor

[[email protected] storm-0.10.0]# ./bin/storm supervisor >> logs/supervisor.out 2>&1 &

[[email protected] storm-0.10.0]# tail -f logs/supervisor.log

启动slave2中的supervisor

[[email protected] storm-0.10.0]# ./bin/storm supervisor >> logs/supervisor.out 2>&1 &

[[email protected] storm-0.10.0]# tail -f logs/supervisor.log

3.5、启动logviewer

[[email protected] storm-0.10.0]# ./bin/storm logviewer >> logs/logviewer.out 2>&1 &
[[email protected] storm-0.10.0]# tail -f logs/logviewer.log

验证：浏览器打开webUI，http://192.168.230.129:8080

3.6、在master提交topology

[[email protected] storm-0.10.0]# ./bin/storm jar examples/storm-starter/storm-starter-topologies-0.10.0.jar storm.starter.WordCountTopology wordcount

时间： 2024-09-29 01:38:17

Storm分布式集群搭建的相关文章

基于Hadoop的数据分析综合管理平台之Hadoop、HBase完全分布式集群搭建

能够将热爱的技术应用于实际生活生产中,是做技术人员向往和乐之不疲的事. 现将前期手里面的一个项目做一个大致的总结,与大家一起分享.交流.进步.项目现在正在线上运行,项目名--基于Hadoop的数据分析综合管理平台. 项目流程整体比较清晰,爬取数据(txt文本)-->数据清洗-->文本模型训练-->文本分类-->热点话题发现-->报表"实时"展示,使用到的技术也是当今互联网公司常用的技术:Hadoop.Mahout.HBase.Spring Data Had

分布式实时日志系统（四）环境搭建之centos 6.4下hbase 1.0.1 分布式集群搭建

一.hbase简介 HBase是一个开源的非关系型分布式数据库(NoSQL),它参考了谷歌的BigTable建模,实现的编程语言为 Java.它是Apache软件基金会的Hadoop项目的一部分,运行于HDFS文件系统之上,为 Hadoop 提供类似于BigTable 规模的服务.因此,它可以容错地存储海量稀疏的数据.HBase在列上实现了BigTable论文提到的压缩算法.内存操作和布隆过滤器.HBase的表能够作为MapReduce任务的输入和输出,可以通过Java API来存取数据,也可以

kafka系列二：多节点分布式集群搭建

上一篇分享了单节点伪分布式集群搭建方法,本篇来分享一下多节点分布式集群搭建方法.多节点分布式集群结构如下图所示: 为了方便查阅,本篇将和上一篇一样从零开始一步一步进行集群搭建. 一.安装Jdk 具体安装步骤可参考 linux安装jdk. 二.安装与配置zookeeper 下载地址:https://www-us.apache.org/dist/zookeeper/stable/ 下载二进制压缩包 zookeeper-3.4.14.tar.gz,然后上传到linux服务器指定目录下,本次上传目录为

Hadoop 分布式集群搭建 & 配置

一. 安装Java Java下载官网下载合适的jdk,本人使用的是jdk-7u79-linux-x64.tar.gz,接下来就以该版本的jdk为例,进行Java环境变量配置创建Java目录在/usr/local目录下创建java目录,用于存放解压的jdk cd /usr/local mkdir java 解压jdk 进入java目录 cd java tar zxvf jdk-7u79-linux-x64.tar.gz 配置环境变量编辑profile文件 cd /etc vim profi

Hadoop伪分布式集群搭建总结

Hadoop伪分布式集群搭建总结一.所需软件VMware15!CentOS6.5JDK1.8Hadoop2.7.3二.安装注意:对文件进行编辑:输入a,表示对该文件进行编辑,最后保存该文件,操作为:点击键盘上的Esc按钮,然后输入英文的:字符,再输入wq,点击回车,完成文件的保存.1.关闭防火墙和禁用SELINUX(1).永久关闭防火墙,重启Linux系统(2) .禁用SELINUX:修改文件参数重启Linux使其生效(3).检查防火墙是否运行,显示下图即为关闭2.配置hostname与IP

Hadoop全分布式集群搭建（详细）

一.准备物理集群.1.物理集群搭建方式.采用搭建3台虚拟机的方式来部署3个节点的物理集群.2.虚拟机准备.准备一个已近建好的虚拟机进行克隆.(建议为没进行过任何操作的)在要选择克隆的虚拟机上右击鼠标,管理,克隆.在弹出对话框中进行以下操作.(1).下一步.(2).选择虚拟机中的当前状态,下一步. (3).选择创建完整克隆,下一步.(4).输入虚拟机名称,下一步.(5).克隆完成.(6).按照上述步骤再创建一个虚拟机名称为slave02的.3.虚拟机网络配置.由于slave01和slave02虚拟

MinIO 分布式集群搭建

MinIO 分布式集群搭建分布式 Minio 可以让你将多块硬盘(甚至在不同的机器上)组成一个对象存储服务.由于硬盘分布在不同的节点上,分布式 Minio 避免了单点故障. Minio 分布式模式可以搭建一个高可用的对象存储服务,你可以使用这些存储设备,而不用考虑其真实物理位置. (1)数据保护分布式 Minio 采用纠删码(erasure code)来防范多个节点宕机和位衰减(bit rot). 分布式 Minio 至少需要 4 个节点,使用分布式 Minio 就自动引入了纠删码功能. 纠

阿里云ECS服务器部署HADOOP集群（三）：ZooKeeper 完全分布式集群搭建

本篇将在阿里云ECS服务器部署HADOOP集群(一):Hadoop完全分布式集群环境搭建的基础上搭建,多添加了一个 datanode 节点 . 1 节点环境介绍: 1.1 环境介绍: 服务器:三台阿里云ECS服务器:master, slave1, slave2 操作系统:CentOS 7.3 Hadoop:hadoop-2.7.3.tar.gz Java: jdk-8u77-linux-x64.tar.gz ZooKeeper: zookeeper-3.4.14.tar.gz 1.2 各节点角色

Hadoop完全分布式集群搭建

Hadoop的运行模式 Hadoop一般有三种运行模式,分别是: 单机模式(Standalone Mode),默认情况下,Hadoop即处于该模式,使用本地文件系统,而不是分布式文件系统.,用于开发和调试. 伪分布式模式(Pseudo Distrubuted Mode),使用的是分布式文件系统,守护进程运行在本机机器,模拟一个小规模的集群,在一台主机模拟多主机,适合模拟集群学习. 完全分布式集群模式(Full Distributed Mode),Hadoop的守护进程运行在由多台主机搭建的集群上