RabbitMQ和Kafka到底怎么选？

全栈架构社区

共 2981字，需浏览 6分钟

·

2021-11-08 12:17

相关阅读：

300本计算机编程的经典书籍下载

AI全套：Python3+TensorFlow打造人脸识别智能小程序

最新人工智能资料-Google工程师亲授 Tensorflow－入门到进阶

Java架构全阶段七期完整

黑马头条项目 - Java Springboot2.0（视频、资料、代码和讲义）14天完整版

Spring核心编程思想

来源：cnblogs.com/haolujun/p/9632835.html

前言

开源社区有好多优秀的队列中间件，比如RabbitMQ和Kafka，每个队列都貌似有其特性，在进行工程选择时，往往眼花缭乱，不知所措。对于RabbitMQ和Kafka，到底应该选哪个？

RabbitMQ架构

RabbitMQ是一个分布式系统，这里面有几个抽象概念。

broker：每个节点运行的服务程序，功能为维护该节点的队列的增删以及转发队列操作请求。
master queue：每个队列都分为一个主队列和若干个镜像队列。
mirror queue：镜像队列，作为master queue的备份。在master queue所在节点挂掉之后，系统把mirror queue提升为master queue，负责处理客户端队列操作请求。注意，mirror queue只做镜像，设计目的不是为了承担客户端读写压力。

如上图所示，集群中有两个节点，每个节点上有一个broker，每个broker负责本机上队列的维护，并且borker之间可以互相通信。集群中有两个队列A和B，每个队列都分为master queue和mirror queue（备份）。那么队列上的生产消费怎么实现的呢？

队列消费

如上图有两个consumer消费队列A，这两个consumer连在了集群的不同机器上。RabbitMQ集群中的任何一个节点都拥有集群上所有队列的元信息，所以连接到集群中的任何一个节点都可以，主要区别在于有的consumer连在master queue所在节点，有的连在非master queue节点上。

因为mirror queue要和master queue保持一致，故需要同步机制，正因为一致性的限制，导致所有的读写操作都必须都操作在master queue上（想想，为啥读也要从master queue中读？和数据库读写分离是不一样的。），然后由master节点同步操作到mirror queue所在的节点。即使consumer连接到了非master queue节点，该consumer的操作也会被路由到master queue所在的节点上，这样才能进行消费。

队列生产

原理和消费一样，如果连接到非 master queue 节点，则路由过去。

所以，到这里小伙伴们就可以看到 RabbitMQ的不足：由于master queue单节点，导致性能瓶颈，吞吐量受限。虽然为了提高性能，内部使用了Erlang这个语言实现，但是终究摆脱不了架构设计上的致命缺陷。

Kafka

说实话，Kafka我觉得就是看到了RabbitMQ这个缺陷才设计出的一个改进版，改进的点就是：把一个队列的单一master变成多个master，即一台机器扛不住qps，那么我就用多台机器扛qps，把一个队列的流量均匀分散在多台机器上不就可以了么？注意，多个master之间的数据没有交集，即一条消息要么发送到这个master queue，要么发送到另外一个master queue。

另外，关注互联网架构师公众号，回复“面试”，送你一份面试题宝典！

这里面的每个master queue 在Kafka中叫做Partition，即一个分片。一个队列有多个主分片，每个主分片又有若干副分片做备份，同步机制类似于RabbitMQ。

如上图，我们省略了不同的queue，假设集群上只有一个queue（Kafka中叫Topic）。每个生产者随机把消息发送到主分片上，之后主分片再同步给副分片。

队列读取的时候虚拟出一个Group的概念，一个Topic内部的消息，只会路由到同Group内的一个consumer上，同一个Group中的consumer消费的消息是不一样的；Group之间共享一个Topic，看起来就是一个队列的多个拷贝。

所以，为了达到多个Group共享一个Topic数据，Kafka并不会像RabbitMQ那样消息消费完毕立马删除，而是必须在后台配置保存日期，即只保存最近一段时间的消息，超过这个时间的消息就会从磁盘删除，这样就保证了在一个时间段内，Topic数据对所有Group可见（这个特性使得Kafka非常适合做一个公司的数据总线）。

队列读同样是读主分片，并且为了优化性能，消费者与主分片有一一的对应关系，如果消费者数目大于分片数，则存在某些消费者得不到消息。

由此可见，Kafka绝对是为了高吞吐量设计的，比如设置分片数为100，那么就有100台机器去扛一个Topic的流量，当然比RabbitMQ的单机性能好。

总结

本文只做了Kafka和RabbitMQ的对比，但是开源队列岂止这两个，ZeroMQ，RocketMQ，JMQ等等，时间有限也就没有细看，故不在本文比较范围之内。

所以，别再被这些五花八门的队列迷惑了，从架构上找出关键差别，并结合自己的实际需求（比如本文就只单单从吞吐量一个需求来考察）轻轻松松搞定选型。最后总结如下：

吞吐量较低：Kafka和RabbitMQ都可以。
吞吐量高：Kafka。

本文内容参考自RabbitMQ和KafKa官方文档，所以真要搞懂一个中间件的原理最好去看官方文档，文档里面有详细的设计方案，我们可以自己进行设计方案的对比，从而找出符合自己实际情况的中间件。

全栈架构社区交流群

「全栈架构社区」建立了读者架构师交流群，大家可以添加小编微信进行加群。欢迎有想法、乐于分享的朋友们一起交流学习。

扫描添加好友邀你进架构师群，加我时注明【姓名+公司+职位】

看完本文有收获？请转发分享给更多人

往期资源：

Flutter 移动应用开发实战视频（开发你自己的抖音APP）

Java面试进阶训练营第2季（分布式篇）

Java高级 - 分布式系统开发技术视频

最新人工智能资料-Google工程师亲授 Tensorflow2.0－入门到进阶
2019微专业 - 初级大前端开发工程师
AI全套：Python3+TensorFlow打造人脸识别智能小程序
重磅价值视频：TCP_IP协议基础视频教程
2019最新Python视频：从入门到Swiper项目实战
2019年Android应用程序开发
2019重磅高级资源：Java并发编程原理和实战
最新黑马大数据资源：深入解析docker容器化技术
2019大数据挖掘最新教程
新浪微博资深大牛全方位剖析 iOS 高级面试视频
最新Java后端实战视频：SSM框架在线商城系统
2019最新黑客技术之Windows网络安全精讲
2019最新Python实战视频：Python+Django项目实
黑马 - Python数据结构与算法系列课程

浏览 37

点赞

收藏

分享

举报

评论

图片

表情

RabbitMQ和Kafka到底怎么选？

开发者全社区

RabbitMQ和Kafka到底怎么选？

互联网架构师

RabbitMQ 和 Kafka 到底怎么选？

懵了，Kafka、RabbitMQ到底选哪个？

OAuth2 vs JWT，到底怎么选？

Java研发军团

OAuth2 vs JWT，到底怎么选？

OAuth2 vs JWT，到底怎么选？

OAuth2 vs JWT，到底怎么选？

私域工具到底怎么选？

企业微信赛道近一两年来很扎堆，让人傻傻分不清楚，导致选择成本很高。我们一线销售拓客时也经常被问到，卫瓴·企微助手跟尘锋、探马、微伴、群脉、微盛这些产品是不是差不多呀？答案是：大大不一样。今天就跟大家交流下，私域工具应该怎么选。 01 选工具前，要分清场景：B2B还是B2C？ “私域运营、加好友、红包裂变、群sop、拼团、社群运营”这些词想必很多人都已经耳熟能详了，不过这都是典型的B2C私域场景，to C本身意味着以服务海量用户为目标，因此相关的数字化转型动作也更容易吸引市场的关注。 B2C的SCRM也成了教育市场的第一线，90%的SCRM赛道选手也都是靠提供拉群工具、裂变工具拿到入场券的。显然，私域工具们也成功引

OAuth2 vs JWT，到底怎么选？

点赞

收藏

分享

举报