storm在windows系统下安装调试

基础知识

Storm是一个分布式的,可靠的,容错的数据流处理系统。它会把工作任务委托给不同类型的组件,每个组件负责处理一项简单特定的任务。Storm集群的输入流由一个被称作spout的组件管理,spout把数据传递给bolt, bolt要么把数据保存到某种存储器,要么把数据传递给其它的bolt。你可以想象一下,一个Storm集群就是在一连串的bolt之间转换spout传过来的数据。

概念解释:

  • spout: 读取原始数据为bolt提供数据。
  • bolt: 从spout或其它bolt接收数据,并处理数据,处理结果可作为其它bolt的数据源或最终结果。
  • nimbus: 主节点的守护进程,负责为工作节点分发任务。
  • topology: 拓扑结构,Storm的一个任务单元。
  • define field(s): 定义域,由spout或bolt提供,被bolt接收。

安装:

安装 zookeeper :

  • 下载 zookeeper :http://zookeeper.apache.org/releases.html#download
  • 将 zookeeper-3.4.7.tar.gz 解压到目录,D:\bin\zookeeper-3.4.7。
  • 复制文件 D:\bin\zookeeper-3.4.7\conf\zoo_sample.cfg 为同目录下的 zoo.cfg。
  • 根据需要修改zoo.cfg的内容。
  • 运行 D:\bin\zookeeper-3.4.7\bin\zkServer.cmd 。

安装 storm :

运行出错处理 :

  • 如果报Java版本问题,请安装jdk1.7,并正确设置 JAVA_HOME。
  • 设置环境变量 STORM_HOME=D:\bin\apache-storm-0.10.0 。
  • 设置环境变量 STORM_CONF_DIR=%STORM_HOME%\conf 。
  • 出现“java.net.malformedurlexception unknown protocol D”错误,请设置环境变量 STORM_LOGBACK_CONFIGURATION_FILE=file:///D:/bin/apache-storm-0.10.0/log4j2/cluster.xml
  • 如果报“Unable to delete file”错误,是storm的一个bug,0.8.2版本还没有解决,这个错误在cluster.shutdown();时候抛出。用0.10.0版本不会出现这样的问题。

Storm Web UI 界面如下:

开始一个简单的例子

  • class WordReader :从文件中读取文本内容,每读取一行 emit 给 bolts。
  • class WordNormalizer :将一行文本内容按单词切分。
  • class WordCounter :统计单词出现的次数。
  • class TopologyMain :创建拓扑结构。

源代码见文件附件:examples-ch02-getting_started.zip。

本机调试

在开发工具中,直接运行TopologyMain,即可开始体验strom

把Topology发布到集群中

需要把 LocalCluster 换成 StormSubmitter 并调用submitTopology方法

    //LocalCluster cluster = new LocalCluster();
    //cluster.submitTopology("Count-Word-Topology-With-Refresh-Cache", conf,
    //builder.createTopology());
    StormSubmitter.submitTopology("Count-Word-Topology-With_Refresh-Cache", conf,
            builder.createTopology());
    //Thread.sleep(1000);
    //cluster.shutdown();

接下来,把源码压缩成一个jar包,运行Storm客户端命令,把拓扑提交给集群。如果你已经使用了Maven, 你只需要在命令行进入源码目录运行:mvn package。

现在你生成了一个jar包,使用storm jar命令提交拓扑。命令格式:storm jar allmycode.jar org.me.MyTopology arg1 arg2 arg3。

对于这个例子,在拓扑工程目录下面运行:

storm jar Topologies-0.0.1-SNAPSHOT.jar countword.TopologyMain src/main/resources/words.txt

通过这些命令,你就把拓扑发布集群上了。

如果想停止或杀死它,运行:

storm kill Count-Word-Topology-With-Refresh-Cache

参考资料

storm 入门:http://ifeve.com/wp-content/uploads/2014/03/Getting-Started-With-Storm-Jonathan-Leibiusky-Gabriel-E_1276.pdf
官方文档:http://storm.apache.org/documentation.html

说明:

1.此文档中的文件夹位置请根据需要修改。
2.此文档中中使用的软件版本不一定是最新的。

时间: 2024-08-24 22:38:53

storm在windows系统下安装调试的相关文章

storm在linux系统下安装调试

安装: 安装 zookeeper : 下载 zookeeper :http://zookeeper.apache.org/releases.html#download. 将 zookeeper-3.4.7.tar.gz 解压到目录,/usr/local/zookeeper-3.4.7. 拷贝zookeeper的conf/zoo_sample.cfg并重命名为zoo.cfg,内容修改如下: # The number of milliseconds of each tick tickTime=200

在 Windows 系统下安装 IntelliJ IDEA 的方法

首先,进入官网下载 IntelliJ IDEA 可执行文件:http://www.dongguanqingjiegongsi.cn/ 1 如上图所示,进入"Download IntelliJ IDEA"页面,显然咱们可以看到 IntelliJ IDEA 分为两个版本,分别为: 旗舰版(Ultimate)社区版(Community)其中,旗舰版是收费的,社区版则是免费的.至于两者的区别嘛,就是旗舰版比社区版的功能更为齐全!如果你想用 IntelliJ IDEA 进行大型项目开发的的话,啥

windows系统下安装Eclipse for PHP

第一步: 如果机器上没有java运行环境,请先安装 第二步: 下载eclipse,下载地址: http://www.eclipse.org/downloads/ 选择对应版本,本人选择的是64位版本,根据机器配置下载相应版本的eclipse 解压你想要安装的目录下(然后可以做个快捷方式) 第三步: 下载PDT,下载地址:http://www.eclipse.org/pdt/downloads/ 本人下载的是All-In-One package including Eclipse 3.7.2 an

nssm常用命令(在Windows系统下安装服务的工具)

nssm install servername //创建servername服务 nssm start servername //启动服务 nssm stop servername //暂停服务 nssm restart servername //重新启动服务 nssm remove servername //删除创建的servername服务 在Windows系统下安装服务的工具 官网网址:http://www.nssm.cc 工具下载地址:http://www.nssm.cc/downloa

windows系统下安装MySQL

可以运行在本地windows版本的MySQL数据库程 序自从3.21版以后已经可以从MySQL AB公司获得,而且 MYSQL每日的下载百分比非常大.这部分描述在windows上安装MySQL的过程. 安装程序是针对windows版本的MySQL 5.0,结合了图形安装向导,自动的安装MySQL,创建 一个配置文件,启动服务器,和保护默认的用户帐户. 如果你是升级安装现有的MySQL 4.1.5版本.你必须完成下列步骤: 1. 获得和安装 2. 如果有必要安装配置文件 3. 选择一个想要使用的服

Windows系统下安装VirtualBox,系统找不到指定路径的做法

在虚拟机软件中,VMware.Virtual PC等都不支持目前Windows 8各版本的安装.无奈之下,只剩下一个选择——VitualBox. 但是很多朋友在下载VitualBox之后,在Windows 7下安装碰到了问题(Windows Vista.Windows XP系统也一样),他会弹出一个对话框“Installation failed! Error: 系统找不到指定的路径.”(一些较早期的VitualBox会显示为“Installation failed!ERROR:3”) 这个问题产

windows系统下安装pygame

pygame的安装,我相信很多人都有点苦恼,第一:不知道去哪里寻找下载文件.第二:该下载哪个文件.第三:下载了正确文件后又该如何安装?这个随笔既是为了帮助大家快速下载pygame,也是为了以后自己忘记如何下载安装方可以有个提供回忆的便签!(工科生,文笔不佳,请多谅解) 我将从上面提出的三个问题来逐个解决pygame的下载安装过程! 第一:去哪里寻找pygame的下载文件?https://bitbucket.org/pygame/pygame/downloads/ 第二:该下载哪个文件? 1.你首

三种方案在Windows系统下安装ubuntu双系统

一.虚拟机安装(不推荐) 使用工具:Vmware 如果不是因为迫不得已,比如Mac OS对硬件不兼容,Federa安装频繁出错,各种驱动不全等等,不推荐使用虚拟机安装. 个人感觉这是一种对操作系统的亵渎,因为你得的到它的人,却没有得到它的心. 但是虚拟机的安装也并不是毫无优点,不用担心网卡显卡声卡的驱动问题,不用担心硬件不兼容之类的. 下面来简单说一下操作步骤. 1.下载ubuntu的镜像文件 这个直接去官网就可以下载到: http://www.ubuntu.com/download/deskt

【UEFI+GPT/BIOS+MBR】两种模式在Windows系统下安装Ubantu系统

最近在联想Windows10下安装了Ubantu16.04的系统,踩了很多坑,写下来分享一下. 通过网络资料,理解BIOS+MBR一直是之前电脑的Windows系统安装和引导的模式,但Win8问世后,基本上都采用UEFI+GPT模式了.这两种模式在安装Ubantu系统的时候有一点小小的区别. 一.将Windows10系统分区,划出Ubantu系统的单独盘 因为不知道安系统时会出现什么问题,所以最好从其它盘中单独划出一个盘来安装Ubantu系统,我的F盘内容不多,所以划分了一半出来,大概63GB大