RabbitMQ 应知应会的面试题
RabbitMQ 相关问题如何解决
MQ 是什么?
MQ(Message Queue)消息队列
用队列机制来实现软件之间的通信,消费者可以到指定队列拉取消息,或者订阅相应的队列,由MQ服务端给其推送消息
什么是队列?
是一种数据结构,遵循 FIFO (先进先出)原则
凭啥要使用 MQ , MQ 有啥优势?
异步通信
将以前也不中不必要的同步操作,优化成异步操作,提高性能
业务解耦
将原有A模块直接调用B模块的接口,优化成,A模块的请求给到MQ,A模块的事情就做完了
MQ会主动推给B模块,或者B模块自己来拉
流量削峰
当某一时间大量的流量打到服务器上,服务器一时间无法承受,会宕机
这个时候,若请求都是从消息队列里面出来,则能够保证这种大流量的情况下,服务器仍然能够有序的稳定的处理请求
MQ 有啥劣势呢?
系统可用性降低,对外部有依赖了
需要考虑 MQ 消息丢失,重复消费的问题
需要花费精力保证消息的顺序性,一致性
常用 MQ 性能对比
ActiveMQ | RabbitMQ | RocketMQ | Kafka | |
---|---|---|---|---|
开发语言 | java | erlang | java | scala |
单机吞吐量 | 万级 | 万级 | 十万级 | 十万级 |
时效性 | ms级 | us级 | ms级 | ms级以内 |
可用性 | 高 主从架构 | 高 主从架构 | 非常高 分布式架构 | 非常高 分布式架构 |
消息可靠性 | 较低概率丢失消息 | 基本不丢 | 可以做到基本不丢 | 可以做到基本不丢 |
功能支持 | 支持功能全 | 性能好 延时低 并发能力强 | MQ 功能较完善 支持分布式,扩展性好 | 主要用于大数据和日志采集 |
MQ 如何避免消息堆积
提高消费速率(集群的方式)
消费者批量获取消息进行消费
MQ 如何避免消费者重复消费(幂等性问题)
全局ID(增加标志位) + 保证业务一致性
MQ 如何保证消息不丢失
消息确认机制
持久化
消息 ACK
MQ 如何保证消息顺序一致性
绑定同一个消费者和队列
MQ 推与拉取架构模型是怎么样的?
MQ 服务器与消费者建立长连接后,MQ 服务器会主动推数据给到消费者
当消费者第一次启动的时候,会去找MQ 服务器拉数据
mq有哪些消费模式
推模式 注册一个消费者后,RabbitMQ会在消息可用时,自动将消息进行推送给消费者。这种方式效率最高最及时。
拉模式 属于一种轮询模型,发送一次get请求,获得一个消息。如果此时RabbitMQ中没有消息,会获得一个表示空的回复。
自动确认
消费者消费消息的时候,将自动向RabbitMQ进行确认。
手动确认
消费者消费消息的时候,手动调用相应函数进行ack 应答
qos预取模式
在确认消息被接收之前,消费者可以预先要求接收一定数量的消息,在处理完一定数量的消息后,批量进行确认
当然,如果消费者应用程序在确认消息之前崩溃,则所有未确认的消息将被重新发送给其他消费者
RabbitMQ
中既然有了connections
为什么还要有 channel
?
connection 是什么
connection 是 生产者或消费者与 RabbitMQ Broker 建立的连接,是一个TCP连接
一旦 TCP 连接建立起来,客户端紧接着可以创建一个 AMQP 信道(Channel),每个信道都会被指派一个唯一的 ID
信道是建立在 Connection 之上的虚拟连接,多个信道复用一个TCP连接,可以减少性能开销,同时也便于管理
因为一个应用需要向RabbitMQ 中生成或者消费消息的话,都要建一个TCP连接,TCP连接开销非常大,如果遇到使用高峰,性能瓶颈也随之显现
信道复用连接优势:
复用TCP连接,减少性能开销,便于管理
RabbitMQ 保障每一个信道的私密性
当每个信道的流量不是很大时,复用单一的 Connection 可以在产生性能瓶颈的情况下有效地节省 TCP 连接资源
信道本身的流量很大时,这时候多个信道复用一个 Connection 就会产生性能瓶颈,进而使整体的流量被限制了,此时就需要开辟多个 Connection,将这些信道均摊到这些 Connection 中
RabbitMQ
的作用
削峰填谷
生产者和消费者业务解耦
服务间异步通信
定时任务
顺序消费
为什么选择 RabbitMQ
现在的市面上有很多 MQ 可以选择,比如 ActiveMQ、ZeroMQ、Appche Qpid为什么要选择 RabbitMQ?
除了 Qpid,RabbitMQ 是唯一一个实现了 AMQP 标准的消息服务器
可靠性,RabbitMQ 的持久化支持,保证了消息的稳定性
高并发,RabbitMQ 使用了 Erlang 开发语言,Erlang 是为电话交换机开发的语言,天生自带高并发光环,和高可用特性
集群部署简单,正是应为 Erlang 使得 RabbitMQ 集群部署变的超级简单
社区活跃度高,根据网上资料来看,RabbitMQ 也是首选
RabbitMQ 的特点是什么?
可靠
RabbitMQ 使用 如持久化、传输确认及发布确认等机制来保证可靠性
灵活的路由
通过交换器来路由消息
对于典型的路由功能, RabbitMQ 己经提供了一些内置的交换器来实现
针对更复杂的路由功能,可以将多个 交换器绑定在一起,这个就需要通过插件来实现了
扩展性
多个 RabbitMQ 节点可以组成一个集群,也可以根据实际业务情况动态地扩展集群中节点
高可用性
队列可以在集群中的机器上设置镜像,使得在部分节点出现问题的情况下队列仍然可用
支持的协议多
RabbitMQ 除了原生支持 AMQP 协议,还支持 STOMP, MQTT等多种消息中间件协议
多语言客户端
RabbitMQ 几乎支持所有常用语言,比如 GO、 Java、 Python、 Ruby、 PHP等
WEB 管理界面
RabbitMQ 提供了一个易用的用户界面,使得用户可以监控和管理消息、集群中的节点等
命令插件机制
RabbitMQ 提供了许多插件 , 以实现从多方面进行扩展,当然也可以编写自己的插件
生产者Producer和消费者Consumer 有哪些知识点?
生产者
消息生产者,投递消息
消息一般包含两个部分:消息体(
payload
)和标签(Label
)
消费者
消费消息,接收消息
消费者连接到 RabbitMQ 服务器,并订阅到队列
消费消息时只消费消息体,丢弃标签
RabbitMQ 消息持久化中的坑
默认情况下重启服务器会导致消息丢失,我们如何保证重启 RabbitMQ 不丢失数据?
那就是做持久化,持久化需要满足如下三个条件才可以恢复 RabbitMQ 的数据
投递消息的时候 durable 设置为 true,消息持久化
消息已经到达持久化交换器上
消息已经到达持久化的队列上
持久化的工作原理
Rabbit 会将持久化消息写入磁盘上的持久化日志文件,等消息被消费之后,Rabbit 会把这条消息标识为等待垃圾回收
持久化的优缺点
优点
数据持久化,数据不丢失
缺点
对性能有影响,写硬盘比写内存性能低,从而降低服务的吞吐量
RabbitMQ ACK 应答机制
ACK 应答分为手动和自动,各有优劣
如果消息不太重要,丢失也没有影响,那么自动 ACK 会比较方便
如果消息非常重要,不容丢失。那么最好在消费完成后手动 ACK
否则接收消息后就自动 ACK,RabbitMQ 就会把消息从队列中删除。若此时消费者宕机或处理业务失败,那么消息就丢失了
ACK 机制的开发注意事项
如果忘记了 ACK,那么后果很严重
当 Consumer 退出时候,Message 会一直重新分发。然后 RabbitMQ 会占用越来越多的内容,由于 RabbitMQ 会长时间运行,这个” 内存泄漏” 是致命的
为什么需要限流,消费者流量控制
某一时刻,生产者在 RabbitMQ 队列中堆积了很多消息,此时有一个消费者启动,大量的消息会推送到消费者上面,这种瞬时大流量会把消费者打挂
生产者和消费者效率不平衡的情况,会导致消费者端性能下降,服务端卡顿或者崩溃
RabbitMQ 的组成
生产者 producer
消费者 consumer
交换机 exchange
用于接受、分配消息
消息 message
队列 queue
用于存储生产者的消息
信道 channel AMQP
消息推送使用的通道
连接 connections
生成者或者消费者与Rabbit 建立的TCP 连接
路由键 routingKey
用于把生成者的数据分配到交换器上
绑定键 BindingKey
用于把交换器的消息绑定到队列上
连接管理器 ConnectionFactory
应用程序与 Rabbit 之间建立连接的管理器,程序代码中使用
VHost
vhost 可以理解为虚拟 broker,即虚拟机
其内部均含有独立的 queue、exchange 和 binding 等
拥有独立的权限系统,做到资源隔离,资源高效利用
RabbitMQ 的六种模式
single
简单的生产者生产消息,放入队列,消费者消费消息
work
当生产者生产消息的速度大于消费者消费的速度,就要考虑用 work 工作模式,这样能提高处理速度提高负载
work 模式与 single 模式类似, 只是work 模式比 single 模式多了一些消费者
publish
应用场景:简单消息队列的使用,一个生产者一个消费者
routing
消息生产者将消息发送给交换机按照路由判断,路由是字符串(info) 当前产生的消息携带路由字符(对象的方法),交换机根据路由的key
只能匹配上路由key对应的消息队列,对应的消费者才能消费消息
topic
话题模式,一个消息被多个消费者获取,消息的目标 queue 可用 BindingKey 以通配符
rpc
通过远程过程调用的方式实现
存储机制
持久化消息
持久化的消息在到达队列时就被写入磁盘,持久化的消息也会在内存中保存一份备份,这样可以提高一定的性能,当内存吃紧的时候会从内存中清除
非持久化消息
一般只保存在内存中,在内存吃紧的时候会被换入到磁盘中,以节省内存空间
RabbitMQ中消息可能有的几种状态
alpha
消息内容(包括消息体、属性和 headers) 和消息索引都存储在内存中
beta
消息内容保存在磁盘中,消息索引保存在内存中
gamma
消息内容保存在磁盘中,消息索引在磁盘和内存中都有
delta
消息内容和索引都在磁盘中
RabbitMQ 的队列结构?
rabbit_amqqueue_process
负责协议相关的消息处理,即接收生产者发布的消息、向消费者交付消息、处理消息的确认等
backing_queue
是消息存储的具体形式和引擎,并向 rabbit_amqqueue_process 提供相关的接口以供调用
交换器无法根据自身类型和路由键找到符合条件队列时,会如何处理?
我们对交换机设置参数的时候,有一个标志叫做 mandatory
当mandatory标志位设置为true时
如果exchange根据自身类型和消息routingKey无法找到一个合适的queue存储消息,那么broker就会调用basic.return方法将消息返还给生产者
当mandatory设置为false时
前置条件和上述保持一致,此时 broker会直接将消息丢弃
如何保证消息可靠性嘞?
消息从生产者到 MQ
由事务机制,确认机制 来保障
MQ 自身可靠性
由持久化、集群、普通模式、镜像模式来保证
MQ 消息到消费者
由basicAck机制、死信队列、消息补偿等机制来保证
集群中的节点类型有哪些?
内存节点
ram,将变更写入内存。
磁盘节点
disc,磁盘写入操作
RabbitMQ中 要求最少有一个磁盘节点
如何保证 RabbitMQ 消息队列的高可用?
RabbitMQ中有三种模式来保证:
单机模式
一般是本地启动,自己学习和测试使用,不会用在生产环境上
普通集群模式
在多台机器上启动多个 RabbitMQ 实例,每个机器启动一个
镜像集群模式
RabbitMQ的高可用模式
跟普通集群模式不一样的是,创建的 queue,无论元数据(元数据指 RabbitMQ 的配置数据)还是 queue 里的消息都会存在于多个实例上,
然后每次写消息到 queue 的时候,都会自动把消息到多个实例的 queue 里进行消息同步
参考资料:
RabbitMQ Tutorials
欢迎点赞,关注,收藏
朋友们,你的支持和鼓励,是我坚持分享,提高质量的动力
好了,本次就到这里
技术是开放的,我们的心态,更应是开放的。拥抱变化,向阳而生,努力向前行。
作者:小魔童哪吒
链接:https://juejin.cn/post/6991610913354678285
来源:掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。