kafka学习总结之kafka核心

1、 Kafka核心组件

（1）replication（副本）、partition（分区）

一个topic可以有多个副本，副本的数量决定了有多少个broker存放写入的数据；副本是以partition为单位的，存放副本即是备份若干个partition，但是只有一个partition被选为Leader用于读写；partition（分区）数量设置最好大于consumer数量（保证每个消费者都有一个partition）。

（2）producer（生产者）

kafka中的producer可以直接发送消息到Leader partition；producer可以决定将消息推送到哪些partition；可以使用批处理（Batch）推送消息，提高效率；一个重要的参数acks（0、-1、1）

（3）consumer（消费者）

消费者分组，同一个group的consumer不能同时消费同一个partition，对于同一个group的consumer，kafka就相当于一个队列消息服务，各个consumer均衡的消费相应partition中的数据。当消费者数大于分区数时，存在leader consumer和follower consumer，leader consumer处理所有的读写请求，当leader consumer挂掉时，follower consumer会成为新的leader consumer。

2、 kafka核心特性

消息集合压缩、消息可靠性（exactly-once）、备份机制、高效性设计（磁盘线性写、B树、sendfile、zero-copy）

时间： 2024-10-29 19:09:55

kafka学习总结之kafka核心的相关文章

kafka学习总结之kafka简介

kafka是一个分布式,基于subscribe-publish的消息系统特性:高吞吐量.低延迟.可扩展性.持久性(消息持久化到本地磁盘).可靠性.容错性(n个副本,允许n-1个节点失败).高并发(支持数千个客户端同时读写) 设计思想: (1) Consumer group:多个consumer可以组成一个group(group-id区分),每个消息只能被组中的一个consumer消费,同时消费一个消息的consumer一定不在同一组: (2) 消息状态:kafka中,消

kafka学习--第一章 kafka的基本架构与角色

一.kafka的基础架构 kafka是一个分布式的基于发布/订阅模式的消息队列,主要应用于大数据实时处理领域. kafka的具体架构如图: 学习kafka的架构前,我们需要了解图中的每个角色: (1)consumer group 消费者组:这是kafka消息队列特有的角色,它是一堆消费组组合成的.消费者组中的每个消费者负责消费不同分区的数据,一个分区只能一个消费者消费,它们互不影响. (2)broker:一台kafka服务器就是一个broker,一个broker可以有多个topic. (3)

kafka学习之路（二）——提高

kafka学习之路(二)--提高消息发送流程因为Kafka内在就是分布式的,一个Kafka集群通常包括多个代理.为了均衡负载,将话题分成多个分区,每个代理存储一或多个分区.多个生产者和消费者能够同时生产和获取消息. 过程: 1.Producer根据指定的partition方法(round-robin.hash等),将消息发布到指定topic的partition里面 2.kafka集群接收到Producer发过来的消息后,将其持久化到硬盘,并保留消息指定时长(可配置),而不关注消息是否

1、Kafka学习分享-V1.0

Kafka学习分享 .1 什么是Kafka Apache Kafka是一个开源的流处理平台,由 Apache Software Foundation使用Scala and Java编写发展而来.Kafka?用于构建实时数据管道和流媒体应用. 它具有水平可扩展性,容错性,快速性,并在数千家公司生产中运行. 它的主要功能:数据流的发布和订阅.数据流的处理.数据流的存储.像一个消息系统一样发布和订阅数据流,有效且实时地处理数据流,在一个分布式备份的集群中安全地处理存储数据流. .2

Kafka 学习笔记之 Producer/Consumer (Scala)

既然Kafka使用Scala写的,最近也在慢慢学习Scala的语法,虽然还比较生疏,但是还是想尝试下用Scala实现Producer和Consumer,并且用HashPartitioner实现消息根据key路由到指定的partition. Producer: import java.util.Properties import kafka.producer.ProducerConfig import kafka.producer.Producer import kafka.producer.Ke

Kafka学习笔记

Apache Kafka 一.消息队列分类 1.1 点对点消息生产者生产消息发送到queue中,然后消息消费者从queue中取出并消费消息注意: 1.消息被消费以后,queue中不再有存储,所以消息消费者不可能消费到已经被消费的消息 2.Queue支持存在多个消费者,但是对一个消息而言,只会有一个消费者可以消费 1.2 发布/订阅消息生产者(发布)将消息发布到topic中,同时有多个消息消费者(订阅)消费该消息.和点对点方式不同,发布到topic的消息会被所有订阅者消费二.消息队

kafka 学习之初体验

学习问题: 1.kafka是否需要zookeeper?2.kafka是什么?3.kafka包含哪些概念?4.如何模拟客户端发送.接受消息初步测试?(kafka安装步骤)5.kafka cluster怎么同zookeeper交互的? 1.kafka是否需要zoopkeeper kafka应用需要zookeeper,可以使用kafka安装包提供的zookeeper,也可以单独下载zookeeper 2.kafka是什么. kafka是一个分布式消息系统.Kafka是一个分布式的.可分区的.可复制的

kafka学习笔记：知识点整理

一.为什么需要消息系统 1.解耦: 允许你独立的扩展或修改两边的处理过程,只要确保它们遵守同样的接口约束. 2.冗余: 消息队列把数据进行持久化直到它们已经被完全处理,通过这一方式规避了数据丢失风险.许多消息队列所采用的"插入-获取-删除"范式中,在把一个消息从队列中删除之前,需要你的处理系统明确的指出该消息已经被处理完毕,从而确保你的数据被安全的保存直到你使用完毕. 3.扩展性: 因为消息队列解耦了你的处理过程,所以增大消息入队和处理的频率是很容易的,只要另外增加处理过程即可. 4.

[Big Data - Kafka] kafka学习笔记：知识点整理

一.为什么需要消息系统 1.解耦: 允许你独立的扩展或修改两边的处理过程,只要确保它们遵守同样的接口约束. 2.冗余: 消息队列把数据进行持久化直到它们已经被完全处理,通过这一方式规避了数据丢失风险.许多消息队列所采用的"插入-获取-删除"范式中,在把一个消息从队列中删除之前,需要你的处理系统明确的指出该消息已经被处理完毕,从而确保你的数据被安全的保存直到你使用完毕. 3.扩展性: 因为消息队列解耦了你的处理过程,所以增大消息入队和处理的频率是很容易的,只要另外增加处理过程即可. 4.

猜你喜欢

linux内存管理-虚拟内存总结

面试被问到虚拟内存,回答的感觉不够.于是重新总结一下. 程序猿对内存的要求都是:私有的.速度快.容量无限大. 对应现在的现况:使用一块物理内存.容量有限.并且速度有限,需要cpu多级缓存. 物理内存暴 ...

Welcome to my first blog. I am a rookie and new comer in the java programming world.And I know that ...

输入数字个数以及要找的位置，输出以字典序为准的那个数

输入 12 4 输出 12 1,10,11,12,2,3,4,5,6,7,8,9 c++的...哎...JRTT第一题 #include <iostream> #include<st ...

Java中的并发工具类

1.等待多线程完成的CountDownLatch CountDownLatch允许一个或多个线程等待其他线程完成操作.join用于让当前执行线程等待join线程执行结束.其实现原理是不 ...

phpjquery抓取网页内容

phpquery抓取网页内容,以下都经过测试,不过phpquery你最好用我上传的,别的不保证,其实我也是下载的. include 'phpQuery/phpQuery.php'; /** phpQu ...

iphone5解锁激活id码iphone5S解锁激活+q:2100997525

百度官网认证QQ[百度唯一认证QQ:2100997525]专业破解苹果ID ,手机微信,手机号码监听,破译陌陌,QQ, 短信内容查询删除开房登记记录通话清单 QQ聊天记录查询删除密码破解邮箱 ...

C# Log4Net配置

Log4Net是用来记录日志的,可以将程序运行过程中的信息输出到一些地方(文件.数据库.EventLog等),日志就是程序的黑匣子,可以通过日志查看系统的运行过程,从而发现系统的问题.日志的作用:将运 ...

JBOSS最大连接数配置和jvm内存配置

一.调整JBOSS最大连接数. 配置deploy/jboss-web.deployer/server.xml文件 . <Connector port="8080" addre ...

关于malloc函数的动态分配问题

malloc函数动态分配了一个整型的内存空间,让abc都指向刚申请的空间,所以只有最后一个赋值语句的值保留在了空间里 #include<stdio.h> main() { int *a,* ...

SQL Server 环形缓冲区（Ring Buffer） -- RING_BUFFER_SCHEDULER_MONITOR 获取SQL

SQL Server 环形缓冲区(Ring Buffer) -- RING_BUFFER_SCHEDULER_MONITOR 获取SQL进程的CPU利用率环形缓冲区存储了有关CPU利用率的信息.这些 ...

PHP笔试题汇总

1.抓取远程图片到本地,你会用什么函数? fsockopen, A 2.用最少的代码写一个求3值最大值的函数. function($a,$b,$c){* W0 z* u6 k+ e. L a: }5 ...

npoi z

http://blog.csdn.net/fireghost57/article/details/25623143 http://www.cnblogs.com/jiagoushi/archive/2 ...

SVN---脱离SVN控制

创建一个记事本文件,然后吧这句话复制进去for /r . %%a in (.) do @if exist "%%a\.svn" rd /s /q "%%a\.svn&qu ...

UIView Animation 与 CACoreAnimation

UIViewAnimation 与 CACoreAnimation 1 定义: 他是一个初步的文档的API或技术在动画提供流体可视化用户界面的不同状态之间的转换.在iOS,动画是广泛使用重新定位观点 ...

编程之美---判断两个链表是否相交

首先,判断一个链表是否有环? 对于这个问题:可以用两个指针,刚开始都指向头节点,然后一个指针每次向后移一步,另一个指针每次向后移两步,如果最后移两步的指针为空时,说明无环,如果最后两个指针相等,说明有 ...

DIOCP开源项目-利用队列+0MQ+多进程逻辑处理，搭建稳定,高效,分布式的服务端

最近头脑里面一直在想怎么样让能让大家基于DIOCP上写出稳定的服务端程序.很多朋友问我,你DIOCP稳定吗,我可以用他来做三层服务器吗? 当时我是这样回答的,我只能保证DIOCP底层通信的稳定. 说实 ...

PHP安全配置之禁用参数

phpinfo() 功能描述:输出 PHP 环境信息以及相关的模块.WEB 环境等信息. 危险等级:中 passthru() 功能描述:允许执行一个外部程序并回显输出,类似于 exec(). 危险等级 ...

线性表的存储和操作

cunqucharudeletefindlengthmerge(hebing); ADT List{ D= { } R= { } Operation: InitList(&L); Destor ...

特征选择，经典三刀（转）

特征选择(Feature Selection,FS)和特征抽取(Feature Extraction, FE)是特征工程(Feature Engineering)的两个重要的方面. 他们之间最大的区 ...

KVM源代码解读：linux-3.17.4\include\uapi\linux\kvm.h

#ifndef __LINUX_KVM_H #define __LINUX_KVM_H /* * Userspace interface for /dev/kvm - kernel based vir ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.022 s.