# 一、MQ的相关概念
# 1、什么是MQ
MQ(message queue),从字面意思上看,本质是个队列,FIFO 先进先出,只不过队列中存放的内容是 message 而已,这是一种跨进程的通信机制,多用于系统之间的异步通信。在互联网架构中,MQ 是一种非常常见的上下游“逻辑解耦+物理解耦”的消息通信服务。使用了 MQ 之后,消息发送上游只需要依赖 MQ,不用依赖其他服务。
MQ通过典型的生产者和消费者模型,生产者不断向消息队列中生产消息,消费者不断的从队列中获取消息。因为消息的生产和消费都是异步的,而且只关心消息的发送和接收,没有业务逻辑的侵入,轻松的实现系统间解耦。
# 2、MQ应用场景
# 1.应用解耦
以电商应用为例,应用中有订单系统、库存系统、物流系统、支付系统。用户创建订单后,如果耦合调用库存系统、物流系统、支付系统,任何一个子系统出了故障,都会造成下单操作异常。当转变成基于消息队列的方式后,系统间调用的问题会减少很多,如下图中订单系统将消息先发送到 MQ 中,MQ 再转发到其他系统。如果此时库存系统出现故障,不会影响整个下单操作,当库存系统恢复后,继续处理订单信息即可;并且如果需求修改,新增了一个 X 系统,此时无需修改订单系统的代码,只需修改 MQ 将消息发送给 X 系统即可。
# 2.流量消峰
举个例子,如果订单系统最多能处理一万次订单,这个处理能力应付正常时段的下单时绰绰有余,正常时段我们下单一秒后就能返回结果。但是在高峰期,如果有两万次下单操作系统是处理不了的,只能限制订单超过一万后不允许用户下单。但是这种情况对于用户来说是很不友好的。
通过使用消息队列做缓冲,我们可以取消这个限制,把一秒内下的订单分散成一段时间来处理,这时有些用户可能在下单十几秒后才能收到下单成功的操作,但是比不能下单的体验要好。
# 3.异步处理
有些服务间的调用是可以异步的,例如 A 调用 B,B 需要花费很长时间执行,但是 A 需要知道 B 什么时候可以执行完,以前一般有两种方式,A 过一段时间去调用 B 的查询 api 查询。或者 A 提供一个 callback api, B 执行完之后调用 api 通知 A 服务。这两种方式都不是很优雅,通过使用消息队列,可以很方便解决这个问题, A 调用 B 服务后,只需要监听 B 处理完成的消息,当 B 处理完成后,会发送一条消息给 MQ,MQ 会将此消息转发给 A 服务。这样 A 服务既不用循环调用 B 的查询 api,也不用提供 callback api。同样 B 服务也不用做这些操作。A 服务还能及时的得到异步处理成功的消息。
# 3、MQ的分类
# 1.ActiveMQ
ActiveMQ 是由 Apache 出品,一款能力强劲的开源消息总线。它是一个完全支持 JMS 规范的的消息中间件。提供丰富的API,多种集群架构模式让 ActiveMQ 在业界成为老牌的消息中间件,在中小型企业颇受欢迎。
- 优点:单机吞吐量万级,时效性 ms 级,可用性高,基于主从架构实现高可用性,消息可靠性较低的概率丢失数据。
- 缺点:官方社区现在对 ActiveMQ 5.x 维护越来越少,高吞吐量场景较少使用。
# 2.Kafka
Kafka 是 LinkedIn开源的分布式发布-订阅消息系统,目前归属于Apache顶级项目。Kafka主要特点是基于Pull的模式来处理消息消费,追求高吞吐量,适合产生大量数据的互联网服务的数据收集业务。是大数据的杀手锏,谈到大数据领域内的消息传输,则绕不开Kafka,这款为大数据而生的消息中间件,以其百万级TPS的吞吐量名声大噪,迅速成为大数据领域的宠儿,在数据采集、传输、存储的过程中发挥着举足轻重的作用。目前已经被LinkedIn,Uber, Twitter, Netflix等大公司所采纳。
- 优点: 性能卓越,单机写入 TPS 约在百万条/秒,最大的优点,就是吞吐量高。时效性 ms 级可用性非常高,kafka 是分布式的,一个数据多个副本,少数机器宕机,不会丢失数据,不会导致不可用,消费者采用 Pull 方式获取消息, 消息有序, 通过控制能够保证所有消息被消费且仅被消费一次;有优秀的第三方 Kafka Web 管理界面 Kafka-Manager;在日志领域比较成熟,被多家公司和多个开源项目使用;功能较为简单,主要支持简单的 MQ 功能,在大数据领域实时计算以及日志采集被大规模使用。
- 缺点:Kafka 单机超过 64 个队列/分区,Load 会发生明显的飙高现象,队列越多,load 越高,发送消息响应时间变长,使用短轮询方式,实时性取决于轮询间隔时间,消费失败不支持重试;支持消息顺序,但是一台代理宕机后,就会产生消息乱序,社区更新较慢;
# 3.RocketMQ
RocketMQ是阿里开源的消息中间件,它是纯Java开发,具有高吞吐量、高可用性、适合大规模分布式系统应用的特点。RocketMQ思路起源于Kafka,但并不是Kafka的一个Copy,它对消息的可靠传输及事务性做了优化,目前在阿里集团被广泛应用于交易、充值、流计算、消息推送、日志流式处理、binglog分发等场景。
- 优点:单机吞吐量十万级,可用性非常高,分布式架构,消息可以做到 0 丢失,MQ 功能较为完善,还是分布式的,扩展性好,支持 10 亿级别的消息堆积,不会因为堆积导致性能下降,源码是 java。
- 缺点:支持的客户端语言不多,目前我了解到有 java 和 c++,其中 c++不成熟;社区活跃度一般,没有在MQ核心中去实现 JMS 等接口,有些系统要迁移需要修改大量代码。
# 4.RabbitMQ
RabbitMQ 是使用 Erlang 语言开发的开源消息队列系统,基于 AMQP 协议(高级消息队列协议)来实现。AMQP 的主要特征是面向消息、队列、路由(包括点对点和发布/订阅)、可靠性、安全。AMQP 协议更多用在企业系统内对数据一致性、稳定性和可靠性要求很高的场景,对性能和吞吐量的要求还在其次。
- 优点:由于 erlang 语言的高并发特性,性能较好;吞吐量到万级,MQ 功能比较完备,健壮、稳定、易用、跨平台、支持多种语言,如:Python、Ruby、.NET、Java、JMS、C、PHP、ActionScript、XMPP、STOMP等,支持 AJAX 文档齐全;开源提供的管理界面非常棒,用起来很好用,社区活跃度高;更新频率相当高。
- 缺点:商业版需要收费,学习成本较高。
# 4、MQ的比较
# 5、AMQP和JMS
AMQP,即 Advanced Message Queuing Protocol,一个提供统一消息服务的应用层标准 高级消息队列协议(二进制应用层协议),是应用层协议的一个开放标准,为面向消息的中间件设计。基于此协议的客户端与消息中间件可传递消息,并不受中间件产品、开发语言等条件的限制。类比 HTTP 协议。
JMS,即 Java Message Service,是 Java 的消息服务,JMS 的客户端之间可以通过 JMS 服务进行异步的消息传输。JMS API 是一个消息服务的标准或者说是规范,允许应用程序组件基于 JavaEE 平台创建、发送、接收和读取消息。一种规范,和 JDBC、Jedis 担任的角色类似。
- JMS 是定义了统一的接口来统一消息操作;AMQP 通过协议统一数据交换格式。
- JMS 必须使用 Java 语言;AMQP 只是协议,与语言无关(跨语言)。
- JMS 规定了两种消息模型(队列模型和发布订阅模型);AMQP 的消息模型更为丰富。
# 二、RabbitMQ简介
RabbitMQ 是一个消息中间件:它接受并转发消息。可以把它当做一个快递站点,当要发送一个包裹时,把包裹先放到快递站,快递员最终会把快递送到收件人那里,按照这种逻辑,RabbitMQ 就是一个快递站,一个快递员帮你传递快件。RabbitMQ 与快递站的主要区别在于,它不处理快件而是接收,存储和转发消息数据。
# 1、四大组成部分
- 生产者:产生数据发送消息的程序是生产者。
- 交换机:交换机是RabbitMQ非常重要的一个部件,一方面它接收来自生产者的消息,另一方面它将消息推送到队列中。交换机必须确切的知道如何处理它接收到的消息,是将这些消息推送到特定队列还是推送到多个队列,亦或者是把消息丢弃,这个得由交换机的类型决定。
- 队列:队列是RabbitMQ内部使用的一种数据结构,尽管消息流经RabbitMQ和应用程序,但它们只能存储在队列中。队列仅受主机的内存和磁盘限制的约束,本质上是一个大的消息缓冲区。许多生产者可以将消息发送到一个队列,许多消费者可以尝试从一个队列接收数据。
- **消费者:**消费与接收具有相似的含义。消费者大多时候是一个等待接收消息的程序。请注意生产者,消费者和消息中间件很多时候并不在同一机器上。同一个应用程序既可以是生产者又是可以是消费者。
# 2、RabbitMQ核心概念
# 1.Producer
消息的生产者。也是一个向交换机发布消息的客户端应用程序。
# 2.Consumer
消息的消费者。表示一个从消息队列中取得消息的客户端应用程序。
# 3.Connection
生产者/消费者和 RabbitMQ 服务器之间建立的 TCP 连接。
# 4.Channel
如果每一次访问 RabbitMQ 都建立一个Connection,在消息量大的时候建立 TCP Connection的开销将是巨大的,效率也较低。Channel是在connection内部建立的逻辑连接,如果应用程序支持多线程,通常每个thread创建单独的channel进行通讯,AMQP method包含了channel id 帮助客户端和message broker 识别 channel,所以channel之间是完全隔离的。Channel作为轻量级的Connection极大减少了操作系统建立TCP connection的开销。
# 5.Broker
消息队列服务器实体。即 RabbitMQ 服务器,是接收和分发消息的应用。
# 6.Queue
消息队列。用来保存消息直到发送给消费者。它是消息的容器,也是消息的终点。消息一直在队列里面,等待消费者链接到这个队列将其取走。
# 7.Exchange
交换机。用来接收生产者发送的消息,并根据分发规则,将这些消息分发给服务器中的队列中。不同的交换机有不同的分发规则。根据分发规则,去匹配查询表中的 routing key,分发消息到queue 中去。
rabbitMQ 交换机类型有4种:
- direct(直连):它会把消息路由到那些 BindingKey RoutingKey完全匹配的队列中。
- fanout(扇形):它会把所有发送到该交换器的消息路由到所有与该交换器绑定的队列中。
- topic(主题):将消息路由到 BindingKey RoutingKey 相匹配的队列中。
- headers(标题):交换器不依赖于路由键的匹配规则来路由消息,而是根据发送的消息内容中headers 属性进行匹配。
直连交换机(dirext exchange)为 RabbitMQ 默认的交换机。
# 8.Binding
消息队列和交换机之间的虚拟连接,绑定中包含routing key,Binding信息保存到交换机的路由表中,作为消息的分发依据。
# 9.Virtual Host
虚拟主机。出于多租户和安全因素设计的,把 AMQP 的基本组件划分到一个虚拟的分组中。每个 Virtual Host 本质上就是一个 mini 版的 RabbitMQ 服务器,拥有自己的队列、交换机、绑定和权限机制。类似于网络中的namespace概念。当多个不同的用户使用同一个 RabbitMQ 服务器时,可以划分出多个虚拟主机。每个用户都可以在自己的 vhost 中创建 exchange/queue。RabbitMQ 默认的虚拟主机路径是/
# 3、RabbitMQ工作模式
RabbitMQ 共有六种工作模式:
- 简单模式(Hello World)
- 工作队列模式(Work Queue)
- 发布订阅模式(Publish/Subscribe)
- 路由模式(Routing)
- 通配符模式(Topics)
- 远程调用模式(RPC,不常用)
# 三、RabbitMQ安装
# 1、安装 Erlang
RabbitMQ 是使用 Erlang 语言编写的,所以在安装 RabbitMQ 前需要先安装 Erlang 环境。
Erlang和RabbitMQ版本对照:https://www.rabbitmq.com/which-erlang.html (opens new window)
Erlang下载地址:https://packagecloud.io/rabbitmq/erlang (opens new window)
#安装Erlang所需的依赖
yum install -y epel-release
# 解压
rpm -Uvh erlang-23.2.7-2.el7.x86_64.rpm
#安装Erlang
yum install -y erlang
#查看Erlang是否安装成功
erl -version
2
3
4
5
6
7
8
9
10
11
# 2、安装RabbitMQ
RabbitMQ官网地址:https://www.rabbitmq.com/download.html (opens new window)
将RabbitMQ的rpm包下载下来并保存到到本地的/usr/local/software
目录下(如果没有software建议自己创建)。
在RabiitMQ安装过程中需要依赖socat插件,首先安装该插件,然后解压RabbitMQ的安装包。
# 安装socat插件
yum install -y socat
# 解压
rpm -Uvh rabbitmq-server-3.8.14-1.el7.noarch.rpm
# 安装
yum install -y rabbitmq-server
2
3
4
5
6
7
8
此处如果安装过程出现错误,有可能是因为主机名的设置不规范导致,建议修改主机名后重新安装。
# 修改文件
vim /etc/sysconfig/network
# 添加如下内容(名字可自定义)
NETWORKING=yes
HOSTNAME=localhost
# 修改文件
vim /etc/hosts
# 添加如下内容:服务器ip 主机名
192.168.222.139 localhost
2
3
4
5
6
7
8
9
10
11
12
安装完成以后启动RabbitMQ
# 启动rabbitmq
systemctl start rabbitmq-server
# 查看rabbitmq状态
systemctl status rabbitmq-server
# 设置开机自启
systemctl enable rabbitmq-server
# 停止rabbitmq
systemctl stop rabbitmq-server
2
3
4
5
6
7
8
9
10
11
显示active则表示服务安装并启动成功。
最后我们想方便的对RabbitMQ进行查看和管理,可以开启web端控制台插件。
# 打开RabbitMQWeb管理界面插件
rabbitmq-plugins enable rabbitmq_management
2
RabbitMQ 默认端口是 5672
,管控台的默认端口为 15672
开启以后就可以在浏览器通过http://192.168.222.139:15672/
访问web管理控制台。
如果发现访问不通大概率是因为防火墙没有开放相应端口,进行如下设置:
# 开放5672,15672端口
firewall-cmd --zone=public --add-port=5672/tcp --permanent
firewall-cmd --zone=public --add-port=15672/tcp --permanent
# 重载让配置生效
firewall-cmd --reload
2
3
4
5
6
RabbitMQ默认自带一个用户名:guest,密码:guest的账户。
进行登录以后会提示该账户只能本地登录,虽然我们可以通过修改rabbitmq.conf配置文件添加loopback_users=none
的方式让guest默认账户允许远程访问,但是不建议这么做,因为这样会带来不必要的安全风险,此处建议做法是新建一个管理员账户,并且自定义设置强密码。
# 创建账户(后面为用户名和密码)
rabbitmqctl add_user admin scr1pt_yang.
#给用户授予管理员角色
rabbitmqctl set_user_tags admin administrator
#给用户授权("/"表示虚拟主机、"admin"表示用户名、".*"".*"".*"表示完整权限)
rabbitmqctl set_permissions -p "/" admin ".*" ".*" ".*"
#查看所有用户
rabbitmqctl list_users
Listing users ...
user tags
admin [administrator]
guest [administrator]
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
使用admin账户进行登录,即可进入rabbitmq的后台控制端。可通过web可视化界面进行各类功能的管理,至此,rabbitmq的安装完成。