Storm是开源的分布式实时计算系统,能够让数据流处理变得简单、可靠,也因此在大数据领域有广泛的实际
应用。下面介绍一下如何在Linux系统上安装Storm。根据Storm官网介绍,安装Storm软件分五步:
- 安装Zookeeper。
- 安装Storm的依赖环境:Java和Python。
- 下载并解压Storm安装包。
- 修改必要的Storm配置文件。
- 启动Storm程序。
一、Storm作为分布式系统,它的运行需要借助Zookeeper来进行协同。因此安装Storm之前需要先安装
Zookeeper。Zookeeper的安装也很简单,详见在Linux上安装Zookeeper。
二、如果参照上面已经安装好了Zookeeper,那么你肯定已经安装好了Java;一般的Linux系统自带Python,
因此第二步可以跳过了。
三、到Storm官网上选择自己想要安装的Storm版本,由于近期参与的一个项目已经使用的是Storm0.9.6版本
的,因此我这里安装的也是Storm0.9.6版本的。下载下来后直接解压就是了。
四、Storm配置文件在Storm的conf/strom.yaml下。它的默认配置选项有很多,详细介绍可以点击这里;但
是我们一般正常运行的话只要修改其中几项就可以了。
1)指定Zookeeper服务器
storm.zookeeper.servers: -"10.0.6.81"。我前面只在10.0.6.81上配置了一台Zookeeper服务器,所以
这里只添加一项。
2)指定Storm主节点
nimbus.host: "10.0.6.81",这里要说明的是Zookeeper和Storm是可以安装在同一台机器上的,他们
使用不同的端口,是不同的进程,只是这样做在生产环境中不利于安全,一台机器挂了就都挂了。
3)配置Storm数据目录
storm.local.dir: "/xxx/xxx",需要说明的是,这个目录要保证有读写权限。另外,Storm配置文件里每
一项配置冒号:后面都要跟一个空格,否则Storm无法识别。
五、启动Storm,在Storm的bin/目录下运行./storm nimbus,推荐用screen命令来运行,因为Storm运行时
会阻塞shell,按Ctrl C会杀死刚刚启的Storm进程。如果屏幕上没有报错的话说明Storm已经安装成功了。
Storm还提供了一个web来查看Storm运行情况,在Storm的bin目录下运行./storm ui,之后在浏览器里输入
http://10.0.6.81:9090进行访问。
Storm默认的ui端口是8080,但是8080端口容易被Tomcat占用,所以我在Storm配置文件strom.yaml里把端
口改成9090,ui.port: 9090。上面的网址不一定非要是Storm主节点才能访问,如果外网的那么任何联网机器都能
访问,如果是内网的,同一个局域网都可以访问。