kafka分区

一、topic下引入partition的作用：
topic是逻辑的概念，partition是物理的概念。
为了性能考虑，如果topic内的消息只存于一个broker，那这个broker会成为瓶颈，无法做到水平扩展。kafka通过算法尽可能的把partition分配到集群的不同服务器上。
partition也可以理解为segment的封装。一个partition对应多个segment。一个segment包含一个数据文件和一个索引文件

二、kafka分区分配策略：

partition.assignment.strategy= range（默认值）或 roundrobin

range策略:分区顺序排序，消费者按照字母排序。
partitions的个数除于消费者线程的总数来决定每个消费者线程消费几个分区。如果除不尽，那么前面几个消费者线程将会多消费一个分区。
假设有3个消费者11个分区
C1-0 将消费 0, 1, 2, 3 分区
C1-2 将消费 4, 5, 6, 7 分区
C1-3 将消费 8, 9, 10 分区
roundrobin策略：分区按照hashcode排序，消费者按照字母排序
假设有3个消费者11个分区
C1-0 将消费 0, 3, 6, 9 分区
C1-2 将消费 1, 4, 7, 10 分区
C1-3 将消费 2, 5, 8 分区

注意：
1、一个分区只能被一个消费者消费，但一个消费者可以消费多个分区的数据
2、新的api中预留了自己实现分配策略的可能性class org.apache.kafka.clients.consumer.RangeAssignor

三、分区修改./kafka-topics.sh --alter --topic topic1 --zookeeper zkip:2181/kafka --partitions 6

原文地址：http://blog.51cto.com/2164097/2063781

时间： 2024-10-15 10:27:48

kafka分区的相关文章

Kafka（五）Kafka分区与副本

Kafka分区和副本都是由副本管理器所管理的,引入副本就是为了提高可用性,整个集群中如何判断代理是否存活? 一个存活的代理必须与Zookeeper保持连接,通过Zookeeper的心跳机制来实现的作为一个Follower副本,该副本不能落后Leader副本太久(怎么算太久?)replica.lag.max.messages配置项确定的,默认为10秒. 满足上面2个条件则认为该副本或者节点处于同步中(in sync).Leader副本会追中所有同步中的节点,一旦一个节点宕机或者落后太久,Lead

Kafka分区原理图

一个Topic的多个分区,被分布在kafka集群中的多个server上.每个分区都有一个server为"leader";leader负责所有的读写操作,如果leader失效,那么将会有其他follower来接管(成为新的leader);follower只是单调的和leader 跟进,同步消息即可.由此可见作为leader的server承载了全部的请求压力,因此从集群的整体考虑,有多少个partitions就意味着有多少个"leader",kafka会将"

kafka分区及副本在broker的分配

部分内容参考自:http://blog.csdn.net/lizhitao/article/details/41778193 下面以一个Kafka集群中4个Broker举例,创建1个topic包含4个Partition,2 Replication:数据Producer流动如图所示: (1) pic (2)当集群中新增2节点,Partition增加到6个时分布情况如下: 副本分配逻辑规则如下: 在Kafka集群中,每个Broker都有均等分配Partition的Leader机会. 上述图Broke

kafka 分区和副本以及kafaka 执行流程，以及消息的高可用

1.Kafka概览 Apache下的项目Kafka(卡夫卡)是一个分布式流处理平台,它的流行是因为卡夫卡系统的设计和操作简单,能充分利用磁盘的顺序读写特性.kafka每秒钟能有百万条消息的吞吐量,因此很适合实时的数据流处理.例如kafka在线日志收集系统可作为flume的实时消息sink端,再通过kafka的消费者将消息实时写入hbase数据库中. 卡夫卡以topic分类对记录进行存储,每个记录包含key-value和timestamp. 1.1卡夫卡系统的组件.角色 broker: 每个正在运

Kafka分区与消费者的关系

1. 前言我们知道,生产者发送消息到主题,消费者订阅主题(以消费者组的名义订阅),而主题下是分区,消息是存储在分区中的,所以事实上生产者发送消息到分区,消费者则从分区读取消息,那么,这里问题来了,生产者将消息投递到哪个分区?消费者组中的消费者实例之间是怎么分配分区的呢?接下来,就围绕着这两个问题一探究竟. 2. 主题的分区数设置在server.properties配置文件中可以指定一个全局的分区数设置,这是对每个主题下的分区数的默认设置,默认是1. 当然每个主题也可以自己设置分区数量,如

Kafka分区分配策略(Partition Assignment Strategy

问题用过 Kafka 的同学用过都知道,每个 Topic 一般会有很多个 partitions.为了使得我们能够及时消费消息,我们也可能会启动多个 Consumer 去消费,而每个 Consumer 又会启动一个或多个streams去分别消费 Topic 里面的数据.我们又知道,Kafka 存在 Consumer Group 的概念,也就是 group.id 一样的 Consumer,这些 Consumer 属于同一个Consumer Group,组内的所有消费者协调在一起来消费订阅主题(su

Kafka 分区分配计算(分区器 Partitions )

KafkaProducer在调用send方法发送消息至broker的过程中,首先是经过拦截器Inteceptors处理,然后是经过序列化Serializer处理,之后就到了Partitions阶段,即分区分配计算阶段.在某些应用场景下,业务逻辑需要控制每条消息落到合适的分区中,有些情形下则只要根据默认的分配规则即可.在KafkaProducer计算分配时,首先根据的是ProducerRecord中的partition字段指定的序号计算分区.读者有可能刚睡醒,看到这个ProducerRecord似

kafka分区消费模型

kafka中处理超大消息的一些考虑

Kafka设计的初衷是迅速处理短小的消息,一般10K大小的消息吞吐性能最好(可参见LinkedIn的kafka性能测试).但有时候,我们需要处理更大的消息,比如XML文档或JSON内容,一个消息差不多有10-100M,这种情况下,Kakfa应该如何处理? 针对这个问题,有以下几个建议: 最好的方法是不直接传送这些大的数据.如果有共享存储,如NAS, HDFS, S3等,可以把这些大的文件存放到共享存储,然后使用Kafka来传送文件的位置信息. 第二个方法是,将大的消息数据切片或切块,在生产端将数

猜你喜欢

TPanel的默认颜色存储在dfm中，读取后在Paint函数中设置刷子的颜色，然后填充整个背景

声明如下: TCustomPanel = class(TCustomControl) private FFullRepaint: Boolean; FParentBackgroundSet: Bool ...

【设计模式】组合模式

组合模式(Composite Pattern),又叫部分整体模式,是用于把一组相似的对象当作一个单一的对象.组合模式依据树形结构来组合对象,用来表示部分以及整体层次.这种类型的设计模式属于结构型模式, ...

Redis主从自动failover

Redis主从架构持久化存在一个问题,即前次测试的结论,持久化需要配置在主实例上才能跨越实例保证数据不丢失,这样以来主实例在持久化数据到硬盘的过程中,势必会造成磁盘的I/O等待,经过实际测试,这个持 ...

【iOS开发之旅】UITableView示例-LOL英雄列表

UITableView示例-LOL英雄列表运行效果 CZHero.h // // CZHero.h // 04-UITableView示例-加载plist文件 // // Created ...

父容器为inline-block的导航栏

常见的水平导航栏实现方法有: 1.li {display:inline} 缺点:内联元素,无法设置长与宽 2.li {float:left} 缺点:需要清除浮动 3.li {display:inlin ...

BZOJ 3720: Gty的妹子树 [树上size分块]

传送门题意: 一棵树,询问子树中权值大于$k$的节点个数,修改点权值,插入新点:强制在线一开始以为询问多少种不同的权值,那道CF的强制在线带修改版,直接吓哭然后发现看错了这不一道树上分块水题.. ...

Azure 混合云调查报告

总的说来混合云才是未来的趋势,现在各家云计算公司都在发力混合云! 本篇力推基于Azure的混合云

Linux RAID卡优化

介绍我们的生产服务器经常会做raid存储,但是单单做了raid就能保证性能高效和数据安全吗?答案是否定的,我们一般建议使用带电池保护的RAID卡,这样既能保证性能有能保证数据安全,但是也需要经常对电 ...

爆炸复合板

爆炸复合板,双金属耐磨复合钢板,钛钢复合管板,阳极爆炸焊块,压力容器爆炸复合板,铝钢过渡接头,爆炸焊接.湖南方恒是爆炸复合焊接行业领跑者,业务咨询:0731-89719827 ???? 湖南方恒复合材 ...

java-处理大容量文本文件，行内分格符为TAB的方法

以处理某sql文件为例源文件中行格式为: 123456 7895433 xxxxx yyyyy zzzzz 行间分隔符为 TAB. 转换完后文件中行的格式为: 123456,7895433,xxx ...

C#_委托与事件

委托: 把方法当作参数进行传递 public delegate void AddDelegate(string name); public class Ad{ //addDelegate就是委托的一个 ...

Visual C++ 对话框增加菜单栏

1.添加菜单资源在resourceview视图中右击选择insert,添加一个菜单资源IDR_MENU1,同时设定好响应的菜单项,例如: 菜单1 ...

jQuery之知识二-选择器

jQuery 最核心的组成部分就是:选择器引擎.它继承了 CSS 的语法,可以对 DOM 元素的标签名.属性名.状态等进行快速准确的选择,并且不必担心浏览器的兼容性.jQuery 选择器实现了 CS ...

【转载】PMC/PEC Boundary Conditions and Plane Wave Simulation

原文链接 PMC/PEC Boundary Conditions and Plane Wave Simulation (FDTD) OptiFDTD now has options to use Pe ...

Gradle Goodness: Adding Tasks to a Predefined Group

In Gradle we can group related tasks using the group property of a task. We provide the name of our ...

怎样删除虚拟机快照

打开虚拟机后右键单击如图所示的地方在下拉菜单中找到“快照管理器”打开后选择你要删除的快照单击左下角的“delet”就是“删除”就ok了.

Linux基础（八）

一.shell shell一般代表两个层面的意思,一个是命令解释器,比如BASH,另外一个就是shell脚本.Python也是一种解释语言. 1. Linux中命令是按照下面的优先级执行的 ==& ...

亚马逊aws ubuntu设置root 密码方式登录方法

LINUX VPS没有ROOT权限是很难受的事,并且密码登陆也方便一些.我的AWS VPS的LINUX版本是UBUNTU 13.10,首先用AWS证书验证的账户登录,1.修改ROOT密码sudo pa ...

Cookie实现免登陆

1.首先要有一个登录界面: 1 <%@ page language="java" import="java.util.*" pageEncoding=&q ...

smarty逻辑运算符

smarty逻辑运算符 eq equal : 相等 neq not equal:不等于 gt greater than:大于 lt less th ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.022 s.