Kafka消息重新发送

Kafka消息重新发送

1、使用kafka消息队列做消息的发布、订阅，如果consumer端消费出问题，导致数据并没有消费，此时不需要担心，数据并不会立刻丢失，kafka会把数据在服务器的磁盘上默认存储7天，或者自己指定有两种方式：1）指定时间，log.retention.hours=168；2）指定大小，log.segment.bytes=1073741824。此时就可以通过重置某个topic的offset来是消息重新发送，进行消费

2、 查看topic的offset的范围

1）使用下面的命令可以查看topic为userlog，broker为spark:9092的offset的最小值：

#./kafka-run-class.sh kafka.tools.GetOffsetShell --broker-list spark:9092 -topic userlog --time -2

2）offset的最大值：

#./kafka-run-class.sh kafka.tools.GetOffsetShell --broker-list spark:9092 -topic userlog --time -1

3、 设置consumer group的offset

1)启动zookeeper，如果使用的是kafka内置的zookeeper，直接启动bin目录下的zookeeper-shell.sh，进行登录：

#./zookeeper-shell.sh localhost:2181

通过如下命令，来重置offset值，比如topic：userlog，group：userlogs，partition：0 ，offset：2181

set /consumers/userlogs/offsets/userlog/0 1288

如果有多个partition都执行上输的命令，并将0换为相对应的分区号就可以了。

###如果创建分区的时候设置了zk的根目录，如localhost:2181/kafka

则重置的命令为：

set /kafka/consumers/userlogs/offsets/userlog/0 1288

2)如果使用单独安装的zookeeper，直接使用bin目录下的ZKCli.sh登录后，执行上述命令即可。

4、 设置完成后需要重启相关的服务，就可以从设置offset的地方开始消费。

重启服务：consumer服务。

时间： 2024-10-04 19:07:48

Kafka消息重新发送的相关文章

【转】解决Maxwell发送Kafka消息数据倾斜问题

最近用Maxwell解析MySQL的Binlog,发送到Kafka进行处理,测试的时候发现一个问题,就是Kafka的Offset严重倾斜,三个partition,其中一个的offset已经快200万了,另外两个offset才不到两百.Kafka数据倾斜的问题一般是由于生产者使用的Partition接口实现类对分区处理的问题,一般是对key做hash之后,对分区数取模.当出现数据倾斜时,小量任务耗时远高于其它任务,从而使得整体耗时过大,未能充分发挥分布式系统的并行计算优势(参考Apache Kaf

源码分析 Kafka 消息发送流程(文末附流程图)

温馨提示:本文基于 Kafka 2.2.1 版本.本文主要是以源码的手段一步一步探究消息发送流程,如果对源码不感兴趣,可以直接跳到文末查看消息发送流程图与消息发送本地缓存存储结构. 从上文初识 Kafka Producer 生产者,可以通过 KafkaProducer 的 send 方法发送消息,send 方法的声明如下: Future<RecordMetadata> send(ProducerRecord<K, V> record) Future<RecordMetada

【Kafka 源码解读】之【代码没报错但是消息却发送失败！】

聊聊最近,2020年,在2019年的年尾时,大家可谓对这年充满新希望,特别是有20200202这一天.可是澳洲长达几个月的大火,新型冠状病毒nCoV的发现,科比的去世等等事情,让大家感到相当的无奈,生命是如此的脆弱,明天又是如此的未知.但是人应当活在当下,勇敢的面对疫情,和大家和政府一起打赢这场没硝烟的战争! 作为程序员,我必定不能停止工作,不能停止学习,现在在家办公,完全配合现在提倡的隔离战术,对自己负责,对社会负责.下面我会和大家分享一篇我之前写的笔记,和大家一起讨论关于 Kafka 的一个

使用kafka消息队列解决分布式事务

微服务框架Spring Cloud介绍 Part1: 使用事件和消息队列实现分布式事务本文转自:http://skaka.me/blog/2016/04/21/springcloud1/ 不同于单一架构应用(Monolith), 分布式环境下, 进行事务操作将变得困难, 因为分布式环境通常会有多个数据源, 只用本地数据库事务难以保证多个数据源数据的一致性. 这种情况下, 可以使用两阶段或者三阶段提交协议来完成分布式事务.但是使用这种方式一般来说性能较差, 因为事务管理器需要在多个数据源之间进行

Kafka消息topic分区

kafka是为分布式环境设计的,因此如果日志文件,其实也可以理解成消息数据库,放在同一个地方,那么必然会带来可用性的下降,一挂全挂,如果全量拷贝到所有的机器上,那么数据又存在过多的冗余,而且由于每台机器的磁盘大小是有限的,所以即使有再多的机器,可处理的消息还是被磁盘所限制,无法超越当前磁盘大小.因此有了partition的概念. kafka对消息进行一定的计算,通过hash来进行分区.这样,就把一份log文件分成了多份.如上面的分区读写日志图,分成多份以后,在单台broker上,比如快速上手中,

apache kafka消息服务

apache kafka中国社区QQ群:162272557 apache kafka参考 http://kafka.apache.org/documentation.html 消息队列分类: 点对点: 消息生产者生产消息发送到queue中,然后消息消费者从queue中取出并且消费消息.这里要注意: 消息被消费以后,queue中不再有存储,所以消息消费者不可能消费到已经被消费的消息. Queue支持存在多个消费者,但是对一个消息而言,只会有一个消费者可以消费. 发布/订阅消息生产者(发布)将消息

一文看懂Kafka消息格式的演变

摘要对于一个成熟的消息中间件而言,消息格式不仅关系到功能维度的扩展,还牵涉到性能维度的优化.随着Kafka的迅猛发展,其消息格式也在不断的升级改进,从0.8.x版本开始到现在的1.1.x版本,Kafka的消息格式也经历了3个版本.本文这里主要来讲述Kafka的三个版本的消息格式的演变,文章偏长,建议先关注后鉴定. Kafka根据topic(主题)对消息进行分类,发布到Kafka集群的每条消息都需要指定一个topic,每个topic将被分为多个partition(分区).每个partition在

如何在优雅地Spring 中实现消息的发送和消费

本文将对rocktmq-spring-boot的设计实现做一个简单的介绍,读者可以通过本文了解将RocketMQ Client端集成为spring-boot-starter框架的开发细节,然后通过一个简单的示例来一步一步的讲解如何使用这个spring-boot-starter工具包来配置,发送和消费RocketMQ消息. 作者简介:辽天,阿里巴巴技术专家,Apache RocketMQ 内核控,拥有多年分布式系统研发经验,对Microservice.Messaging和Storage等领域有深刻

kafka消息通信原理学习(1)

关于 Topic 和 Partition: Topic: 在 kafka 中,topic 是一个存储消息的逻辑概念,可以认为是一个消息集合.每条消息发送到 kafka 集群的消息都有一个类别.物理上来说,不同的 topic 的消息是分开存储的,每个 topic 可以有多个生产者向它发送消息,也可以有多个消费者去消费其中的消息. Partition: 每个 topic 可以划分多个分区(每个 Topic 至少有一个分区),同一 topic 下的不同分区包含的消息是不同的.每个消息在被添加到分区时,

猜你喜欢

HDU 5308 规律+模拟

给出N个数字N,要把所有数字用完,使用+-*/最后变为24,中间运算可以有有浮点数对于1-14直接打表 15以上的可以通过13个相同数字得到24,然后使后面的数全部运算为0相加即可贴一发官方题解 ...

【操作系统】线程

前言: 进程的概念包含了两个不同的特点:1.资源所有权:2.调度/执行能力: 既然这两个特点是独立的,那么操作系统应该能够独立地处理它们,这就引出了线程的概念.为区分这两个特点,我们把分派的单位称为线 ...

模版语言实现瀑布流页面

模板 1.模版的执行模版的创建过程,对于模版,其实就是读取模版(其中嵌套着模版标签),然后将 Model 中获取的数据插入到模版中,最后将信息返回给用户. def current_datetime( ...

HDU 4300 （扩展KMP或KMP）

题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=4300 题意:说实话,看半天题目,愣是没看懂,百度题意才看懂,大概意思就是:第一个串串为匹配串,第i个代 ...

补题清单

HDU 3585 HDU 1693 URAL 1519 FZU 1977 HDU 1964 HDU 3377 POJ 1739 POJ 3133 BZOJ 1025 HDU 4285 专题7 1003 ...

Python在centos下的安装

1.wget http://www.python.org/ftp/python/2.7.9/Python-2.7.9.tgz默认下载到主目录下 2.tar xzf Python-2.6.6.tgz 3 ...

巧妙的邻接表（数组实现）

之前我们介绍过图的邻接矩阵存储法,它的空间和时间复杂度都是N2,现在我来介绍另外一种存储图的方法:邻接表,这样空间和时间复杂度就都是M.对于稀疏图来说,M要远远小于N2.先上数据,如下. 4 5 1 ...

Nexus配置

1.可以为maven项目单独配置nexus路径 <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi=&q ...

jsx

JSX 执行更快,因为它在编译为 JavaScript 代码后进行了优化. 它是类型安全的,在编译过程中就能发现错误. React JSX 代码可以放在一个独立文件上 <script type= ...

【alpha】Scrum站立会议第2次....10.17

小组名称:nice! 小组成员:李权于淼杨柳刘芳芳项目内容:约跑app 1.任务进度成员已完成今日完成李权数据库设计消息发送代码实现于淼注册.登录界面,以及登录界面后台代码.发 ...

新安装的金蝶K3软件，初始化后，在基础资料中对于币别，科目，部门，客户等资料均无法新增，无法引出，等操作，K3CASysSet.dll

新装K3,新建的帐套.导入科目点菜单或新增button均无反应,币别.客户等辅助核算项目也新增也无法保存. 在电脑上新安装的金蝶K3软件.初始化后.在基础资料中对于币别,科目,部门,客户等资料均无法新 ...

几种常见容器比较和分析 hashmap, map, vector, list .

list支持快速的插入和删除,但是查找费时; vector支持快速的查找,但是插入费时. map查找的时间复杂度是对数的,这几乎是最快的,hash也是对数的. 如果我自己写,我也会用二叉检索树,它在大 ...

CecOS v1.4 中文企业云操作系统管理员及用户指南发布

CecOS 项目团队为了使用者更好的安装.使用,我们整理历史版本资料整理成PDF文档,欢迎大家下载阅览及指正. CecOS v1.4 -管理员指南:下载 CecOS v1.4 -用户指南:下载 OPE ...

2017icpc乌鲁木齐网络赛Colored Graph (构造)

题目 https://nanti.jisuanke.com/t/16958 题意给定一个n(n<=500)个点的无向图,给每条边黑白染色,输出同色三角形最少的个数和对应的方案分析首先考虑给 ...

Pro ASP.NET Core MVC 第6版第一章

第一章 ASP.NET Core MVC 的前世今生 ASP.NET Core MVC 是一个微软公司开发的Web应用程序开发框架,它结合了MVC架构的高效性和简洁性,敏捷开发的思想和技术,和.NET ...

HTTP 1.1与HTTP 1.0的比较

一个WEB站点每天可能要接收到上百万的用户请求,为了提高系统的效率,但是,这也造成了一些性能上的缺陷,例如,一个包含有许多图像的网页文件中并没有包含真正的图像数据内容,而只是指明了这些图像的URL地址 ...

C++内存管理学习笔记（6）

/****************************************************************/ /* 学习是合作和分享式的! /* Auth ...

POJ 2960

也算是一道模板题吧,只需按照SG函数的定义求出每个值的SG,然后异或就可以了. 1 #include <iostream> 2 #include <cstdio> 3 #inc ...

Python3 高级用法

# 用生成器(generators)方便地写惰性运算 def double_numbers(iterable): for i in iterable: yield i + i # 生成器只有在需要时才 ...

winfrom自定义控件

c#TabControl控件左边选项卡左边显示,文字横向显示 http://blog.csdn.net/kasama1953/article/details/52133713 WinForm中,给Te ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.024 s.