RabbitMQ和Kafka

起因

最近公司RabbitMQ的集群出了点问题，然后有些亲就说RabbitMQ慢且不好用，是一个瓶颈，不如换成Kafka。而我本人，使用RabbitMQ有一点久了，认为这个事情应当辩证的去看。所以就在没事的时候简单的看了看RabbitMQ的代码。但是我并没有看太多Kafka的代码，我只简单提下。

关于Kafka

根据Kafka官方的文档，Kafka可以被认为一个高大上的集群消息中间件，但是读了下以前一个朋友给的部署文档和Kafka的官方的文档。发现Kafka确实不错，真的可以说是集群消息中间件。

用topic来进行消息管理，每个topic包含多个part，每个part对应一个逻辑log，有多个segment组成。
segment中的消息id由其逻辑位置决定，可以用消息id直接定位到消息的存储位置，避免id到位置的额外映射。
生产者发到某个topic的消息会被均匀的分布到多个part上，broker收到消息会写入最后的segment文件中，当某个segment上的消息条数达到配置值或消息发布时间超过阈值时，segment上的消息会被flush到磁盘，只有flush到磁盘上的消息消费者才能收到。并且通过rolling的机制，保证segment的文件不至于过大。
消费者可以rewind back到任意位置重新进行消费，当消费者故障时，可以选择最小的offset进行重新读取消费消息。

是不是看起来很爽，但是深入往下看，发现了一些深坑

Kafka对消息的重复、丢失、错误以及顺序型没有严格的要求。但是part只会被consumer group内的一个consumer消费，故kafka保证每个parti内的消息会被顺序的消费。
broker没有副本机制，一旦broker宕机，该broker的消息将都不可用。同时broker是无状态的，broker不保存消费者的状态，由消费者自己保存。无状态导也致消息的删除成为难题，所以Kafka选择消息保存一定时间后会被删除。
大量的依赖Zookeeper，需要Zookeeper来管理broker与consumer的动态加入与离开。以及消费关系及每个partion的消费信息。

看到这里，你如果还明白我说这些深坑是什么意思，那就请带入运维场景和特定故障场景思考下。我稍后会说一下这些坑会带来什么问题。

关于RabbitMQ

RabbitMQ是使用Erlang开发的一个消息队列，可以构建成集群，也可以单独使用。

根据测试，RabbitMQ在不使用ACK机制的，Msg大小为1K的情况下，QPS可达6W＋。再双方ACK机制，Msg大小为1K的情况下，QPS瞬间降到了1W＋。从某种意义上RabbitMQ还真是慢，但是我们需要思考下。

我们真的每个消息都能到1K吗？
我们真的需要双方都对消息ACK的系统吗？

好了，如果两个回答都是YES，那么RabbitMQ就是慢的。如果是No，那么RabbitMQ还是一个非常快的队列。

RabbitMQ慢有几个原因：

RabbitMQ做为一个Broker，不单单做到了简单的数据转发功能，还保证了单个队列上的数据有序，即便是有多个消费者和多个生产者。
RabbitMQ的策略是实时转发，而不像Kafka那样等待刷盘之后才让消费者来消费。
如果消费者和生产者不对等，会产生大量的磁盘IO操作，进行消息换出。

RabbitMQ为什么不好用：

AMQP协议本身比较复杂，参数比较多。
Erlang写的，很多人不熟悉，并且Mnesia出现问题好多人解决不了。

RabbitMQ和Kafka相比没价值了吗？

很多亲们读到这里，就会想RabbitMQ好像也不怎么样呀。和Kafka相比没什么价值可言了，但是我前面说了一些Kafka的坑，我就在这里面揭示一下。

Kafka大量依赖Zookeeper，它的broker并不保存任何状态，如果Zookeeper集群不幸悲剧了，那么整个Kafka集群的消息就全完蛋了。
上面问题有人会说这概率好小，我也同样认为这个概率很小，那么一个broker当机呢？当一个broker当机了整个消息队列由于负载均衡的算法，在一瞬间消费者和生产者之间的消息就全乱掉了。很多需要保证消息顺序的系统一下子就完蛋了。

这就是RabbitMQ存在的价值和意义，同时RabbitMQ使用了MirrorQueue的机制，也可以做到多个机器进行热备。

RabbitMQ该怎么用

RabbitMQ的消息应当尽可能的小，并且只用来处理实时且要高可靠性的消息。
消费者和生产者的能力尽量对等，否则消息堆积会严重影响RabbitMQ的性能。
集群部署，使用热备，保证消息的可靠性。

Kafka该怎么用

应当有一个非常好的运维监控系统，不单单要监控Kafka本身，还要监控Zookeeper。
对消息顺序不依赖，且不是那么实时的系统。
对消息丢失并不那么敏感的系统。

时间： 2024-10-25 06:15:40

RabbitMQ和Kafka的相关文章

RabbitMQ和kafka从几个角度简单的对比

RabbitMQ和kafka从几个角度简单的对比业界对于消息的传递有多种方案和产品,本文就比较有代表性的两个MQ(rabbitMQ,kafka)进行阐述和做简单的对比, 1)应用场景 RabbitMQ,遵循AMQP协议,由内在高并发的erlanng语言开发,用在实时的对可靠性要求比较高的消息传递上. kafka是Linkedin于2010年12月份开源的消息发布订阅系统,它主要用于处理活跃的流式数据,大数据量的数据处理上. 2)架构模型 RabbitMQ遵循AMQP协议,RabbitMQ的br

rabbitmq和kafka怎么选？【转】

MQ框架非常之多,今天简单说一下有代表性的两个MQ(rabbitmq和kafka).经常会有人问rabbitmq和kafka到底哪个好呢?其实没有好与不好之分,只有哪个更合适,首先要根据自己项目的业务场景和需求来选择更合适的一个MQ. 在应用场景方面 rabbitmq遵循AMQP协议,由内在高并发的erlanng语言开发,用在实时的对可靠性要求比较高的消息传递上. kafka是Linkedin于2010年12月份开源的消息发布订阅系统,它主要用于处理活跃的流式数据,大数据量的数据处理上. 在架构

RabbitMQ 和 Kafka 的消息可靠性对比

RabbitMQ和Kafka都提供持久的消息保证.两者都提供至少一次和至多一次的保证,另外,Kafka在某些限定情况下可以提供精确的一次(exactly-once)保证. 让我们首先理解一下上述术语的含义: 至多一次投递:消息绝对不会被重复投递,但是消息可能丢失至少一次投递:消息绝对不会被丢失,但是有可能重复被消费精确的一次投递:消息系统的圣杯.所有的消息精确的被投递一次. “投递”貌似不是准确的语言描述,“处理”才是.无论怎么描述,我们关心的是,消费者能否处理消息,以及处理的次数.但是使用

消息中间件面试题31道RabbitMQ+ActiveMQ+Kafka

前言文章开始前,我们先了解一下什么是消息中间件? 什么是中间件? 非底层操作系统软件,非业务应用软件,不是直接给最终用户使用的,不能直接给客户带来价值的软件统称为中间件. 什么是消息中间件? 是关注于数据的发送和接收,利用高效可靠的异步消息传递机制集成分布式系统图示: 消息中间件RabbitMQ+ActiveMQ+Kafka的对比接下来就是消息中间件面试题RabbitMQ+ActiveMQ+Kafka RabbitMQ消息中间件系列 1:RabbitMQ 中的 broker 是指什么?cl

RabbitMQ和Kafka对比

# 前言开源社区有好多优秀的队列中间件,比如RabbitMQ和Kafka,每个队列都貌似有其特性,在进行工程选择时,往往眼花缭乱,不知所措.对于RabbitMQ和Kafka,到底应该选哪个? # RabbitMQ架构 ## 概念 RabbitMQ是一个分布式系统 **broker**:每个节点运行的服务程序,功能为维护该节点的队列的增删以及转发队列操作请求. **master queue**:每个队列都分为一个主队列和若干个镜像队列. **mirror queue**:镜像队列,作为maste

MQ选型对比ActiveMQ,RabbitMQ,RocketMQ,Kafka 消息队列框架选哪个？

最近研究消息队列,发现好几个框架,搜罗一下进行对比,说一下选型说明: 1)中小型软件公司,建议选RabbitMQ.一方面,erlang语言天生具备高并发的特性,而且他的管理界面用起来十分方便.不考虑rocketmq和kafka的原因是,一方面中小型软件公司不如互联网公司,数据量没那么大,选消息中间件,应首选功能比较完备的,所以kafka排除.RocketMQ也很不错,只是没有RabbitMQ出来的早,文档和网上的资料没有RabbitMQ多,但也是很不错,RocketMQ是阿里出品,现在阿里已经把

消息队列原理及ActiveMQ、RocketMQ、RabbitMQ、Kafka区别总结

消息队列为什么写这篇文章? 博主有两位朋友分别是小A和小B: 小A,工作于传统软件行业(某社保局的软件外包公司),每天工作内容就是和产品聊聊需求,改改业务逻辑.再不然就是和运营聊聊天,写几个SQL,生成下报表.又或者接到客服的通知,某某功能故障了,改改数据,然后下班部署上线.每天过的都是这种生活,技术零成长. 小B,工作于某国企,虽然能接触到一些中间件技术.然而,他只会订阅/发布消息.通俗点说,就是调调API.对为什么使用这些中间件啊?如何保证高可用啊?没有充分的认识. 庆幸的是两位朋友都很有

RabbitMQ与Kafka的技术差异以及使用注意点

作为一个有丰富经验的微服务系统架构师,经常有人问我,“应该选择RabbitMQ还是Kafka?”. 基于某些原因, 许多开发者会把这两种技术当做等价的来看待.的确,在一些案例场景下选择RabbitMQ还是Kafka没什么差别,但是这两种技术在底层实现方面是有许多差异的. 不同的场景需要不同的解决方案,选错一个方案能够严重的影响你对软件的设计,开发和维护的能力. 第一篇文章介绍了RabbitMQ和Apache Kafka内部实现的相关概念.本篇文章会从两个方面探讨这两种技术之间的差异,一个是这两种

RabbitMQ和kafka从几个角度简单的对比--转

业界对于消息的传递有多种方案和产品,本文就比较有代表性的两个MQ(rabbitMQ,kafka)进行阐述和做简单的对比, 在应用场景方面, RabbitMQ,遵循AMQP协议,由内在高并发的erlanng语言开发,用在实时的对可靠性要求比较高的消息传递上. kafka是Linkedin于2010年12月份开源的消息发布订阅系统,它主要用于处理活跃的流式数据,大数据量的数据处理上. 1)在架构模型方面, RabbitMQ遵循AMQP协议,RabbitMQ的broker由Exchange,Bindi

猜你喜欢

【BZOJ2039】【2009国家集训队】人员雇佣 [最小割]

人员雇佣 Time Limit: 20 Sec Memory Limit: 259 MB[Submit][Status][Discuss] Description 作为一个富有经营头脑的富翁,小L决 ...

Fabric自动部署太方便了

之前不知道有Fabric工具,每次发布程序到服务器上的时候,基本流程:本地打包程序 -> Ftp上传 -> 停服务器Apache -> 覆盖文件 -> 启动Apache, 非常 ...

Nexus Maven 私服搭建

1.下载Nexus安装文件:http://www.sonatype.org/nexus/go ,目前是nexus-2.13.0-01-bundle.tar.zip这个最新版本: 2.解压到任意目录,我 ...

MFC - 删除指定文件夹

1 // 删除指定的文件夹 2 void DeleteDirectory(CString strDir) 3 { 4 if (strDir.IsEmpty()) 5 { 6 RemoveDirecto ...

鸟哥的Linux私房菜基础学习篇读书笔记（10）：Linux磁盘与文件系统管理（3）

这篇文章主要总结在Linux操作系统中管理我们的硬盘和文件系统所需要用到的命令.当我们在系统中增加了一块硬盘,我们需要经历哪些步骤才能真正使用这块硬盘呢?大致可以分为以下步骤: (1)对磁盘进行分区, ...

uva 11610 Reverse Prime

Problem FReverse Prime Input: Standard Input Output: Standard Output There are a few 7 digit positiv ...

阿里云中获取文件及目录列表的方法

1 获取指定bucket下的文件列表(php-sdk 示例) $prefix = 'dir/'; $delimiter = '/'; $nextMarker = ''; $maxkeys = 30; ...

第七天的练习

<!DOCTYPE html> <html> <head> <meta charset="utf-8"> <title> ...

HTML：图片和视频标签的使用

介绍:在html网页中,图片和视频是基本的元素,在网页中插入图片和视频有自己的标签,分别是img.embed,来源都是使用src来链接. 插入图片: <img src="图片的来源&q ...

查看Linus中自带的jdk ,设置JAVA_HOME

在配置hadoop是,进行格式化hadoop的时候,出现找不到jdk 我用Red hat是32位的,没有现成的32位的,敲java , 发现本机有java ,就找了一下其位置找到了jdk-1.6.0 ...

[转载]使用PyQt来编写第一个Python GUI程序

转载自:http://python.jobbole.com/81276/ 英文版出处:http://pythonforengineers.com/your-first-gui-app-with-pyt ...

svn info

工作副本根目录: /home/zhaojing/7505/android_mtk_l1_6753_65c_mp3 URL: http://19.9.0.130/svn/android_mtk_l1_6 ...

让您正确选择网上商城开发公司——勇闯科技

电子商务已经成为我们这个时代最重要和最成功的互联网应用之一,越来越多的人都在通过网上商城来购买商品.在北京的大街上,每天都可以看到骑着电动自行车带着大箱小包的快递人员:在各个网上商城上闲逛,已成为了某 ...

Cocos2d-x游戏开发_客户端与服务器的交互

客户端Cocos2dx(C++) 服务器Mina(Java) 客户端主要使用了Linux的BSD Socket接口进行socket的数据传输连接服务器直接用了Mina框架来接受socket 具体参考 ...

CSS 定位之position

在前端网页布局中,在同一平面上布局,我们大都采用float属性来定位网页元素的位置.但是涉及到弹出层.浮层.页面广告插件等等,都需要CSS中的position属性来定位了,对于初学者来说经常分不清楚是 ...

Active Desktop--桌面字体背景被修改

怎么修改回来步骤如下方法一.在桌面上点击右键 -- 排列图标 -- 去掉“在桌面上锁定Web项目”上的勾. 方法二.右键点击我的电脑 -- 属性 -- 高级 -- 点击“性能”下面的“设置”按钮, ...

linux之通信机制

通信是一个比较重要的概念.只要存在多于一个执行单元(并发),就有可能存在通信. linux上的并发主要分为多进程(任务)和多线程.linux也提供了多个通信机制来支持不同进程或者不同线程之间的信息传递 ...

mongodb 深层次查询

我做的项目只有数据的查询,mongodb数据库是其他公司向里面存放数据和维护. 坑爹是我需要的数据在mongodb中一条记录的很深的层次里面.如图我需要根据参数,取BMV中VL的第M条记录中的BV的 ...

第6章 JPA-Java Persistence API

http://wenku.baidu.com/link?url=aJ5QmzB1QV-FE6Pkfj_AJiM37ByWYNPnscVOS1QydvnmphtwOlZ8BcHaFX6eZSOmsL46 ...

小代码 SHELL 30分钟 online

<html> <HEAD></HEAD> <BODY> <a href="http://c.biancheng.net/cpp/vi ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.024 s.