第1节 storm编程：8、storm的分发策略

8. Storm的分发策略

Storm当中的分组策略，一共有八种：

所谓的grouping策略就是在Spout与Bolt、Bolt与Bolt之间传递Tuple的方式。总共有八种方式：

1）shuffleGrouping（随机分组）随机分组；将tuple随机分配到bolt中，能够保证各task中处理的数据均衡；

2）fieldsGrouping（按照字段分组，在这里即是同一个单词只能发送给一个Bolt）

按字段分组；根据设定的字段相同值得tuple被分配到同一个bolt进行处理；

举例：builder.setBolt("mybolt", new MyStoreBolt(),5).fieldsGrouping("checkBolt",new Fields("uid"));

说明：该bolt由5个任务task执行，相同uid的元组tuple被分配到同一个task进行处理；该task接收的元祖字段是mybolt发射出的字段信息，不受uid分组的影响。

该分组不仅方便统计而且还可以通过该方式保证相同uid的数据保存不重复（uid信息写入数据库中唯一）；

3）allGrouping（广播发送，即每一个Tuple，每一个Bolt都会收到）广播发送：所有bolt都可以收到该tuple

4）globalGrouping（全局分组，将Tuple分配到task id值最低的task里面）全局分组：tuple被发送给bolt的同一个并且最小task_id的任务处理，实现事务性的topology

5）noneGrouping（随机分派）不分组：效果等同于shuffle Grouping.

6）directGrouping（直接分组，指定Tuple与Bolt的对应发送关系）

直接分组：由tuple的发射单元直接决定tuple将发射给那个bolt，一般情况下是由接收tuple的bolt决定接收哪个bolt发射的Tuple。这是一种比较特别的分组方法，用这种分组意味着消息的发送者指定由消息接收者的哪个task处理这个消息。只有被声明为Direct Stream的消息流可以声明这种分组方法。而且这种消息tuple必须使用emitDirect方法来发射。消息处理者可以通过TopologyContext来获取处理它的消息的taskid (OutputCollector.emit方法也会返回taskid)。

7）Local or shuffle Grouping本地或者随机分组，优先将数据发送到本机的处理器executor，如果本机没有对应的处理器，那么再发送给其他机器的executor，避免了网络资源的拷贝，减轻网络传输的压力

8）customGrouping （自定义的Grouping）

原文地址：https://www.cnblogs.com/mediocreWorld/p/11241539.html

时间： 2024-10-07 06:35:23

第1节 storm编程：8、storm的分发策略

8. Storm的分发策略

第1节 storm编程：8、storm的分发策略的相关文章

第1节 storm编程：2、storm的基本介绍

Storm集群上的开发，Topology任务的编写之 WordCountTopology数据流分析（storm编程模型）（一张图说明问题）（四）

storm入门（一）：storm编程框架与举例

1 storm基本概念 + storm编程规范及demo编写

Storm 系列（五）—— Storm 编程模型详解

Storm入门（Storm程序）

【Twitter Storm系列】Storm环境配置及吞吐量测试调优--个人理解

MFC第二节-网络编程

Storm 起步 Zookeeper Storm 单机部署