# RocketMQ

- 官方网站：https://rocketmq.apache.org/zh/
- 中文文档：https://rocketmq.apache.org/zh/docs/

从网上找的工作流程图：

<img width='80%' src='https://silent-detective-d21.notion.site/image/https%3A%2F%2Fs3-us-west-2.amazonaws.com%2Fsecure.notion-static.com%2F4bd3fbf9-f992-4b59-aa8d-cb5b9427b54a%2FUntitled.png?table=block&id=390f5e79-bd3b-4df7-a589-a6b42f4bbcf2&spaceId=60569f3a-f166-46d7-9825-a6cdb259b284&width=1420&userId=&cache=v2'/>

# 普通消息的使用场景

##### 微服务解耦

<img width='80%' src='https://silent-detective-d21.notion.site/image/https%3A%2F%2Fs3-us-west-2.amazonaws.com%2Fsecure.notion-static.com%2Fb915eeaf-8ac8-42ff-bfc2-905e4ab977f9%2F%25E6%259C%25AA%25E5%2591%25BD%25E5%2590%258D%25E6%2596%2587%25E4%25BB%25B6.png?table=block&id=fb776706-35ab-4cf0-bda9-7a4c254701d8&spaceId=60569f3a-f166-46d7-9825-a6cdb259b284&width=1230&userId=&cache=v2'/>

##### 异步执行事件

<img width='80%' src='https://silent-detective-d21.notion.site/image/https%3A%2F%2Fs3-us-west-2.amazonaws.com%2Fsecure.notion-static.com%2Fec792ba7-93be-40f3-a9f2-3446d2969e2f%2F%25E6%259C%25AA%25E5%2591%25BD%25E5%2590%258D%25E6%2596%2587%25E4%25BB%25B6_(1).png?table=block&id=40f2ec24-8403-41c9-8d46-5fc0e8054445&spaceId=60569f3a-f166-46d7-9825-a6cdb259b284&width=1210&userId=&cache=v2'/>

##### 数据集成
<img width='80%' src='https://silent-detective-d21.notion.site/image/https%3A%2F%2Fs3-us-west-2.amazonaws.com%2Fsecure.notion-static.com%2F98d8ceec-6d68-4913-8103-c42edf6098b5%2F%25E6%259C%25AA%25E5%2591%25BD%25E5%2590%258D%25E6%2596%2587%25E4%25BB%25B6_(2).png?table=block&id=60c47f48-b2af-49c7-909d-3357e8b80474&spaceId=60569f3a-f166-46d7-9825-a6cdb259b284&width=1250&userId=&cache=v2'/>

## 生命周期

<img width='80%' src='https://silent-detective-d21.notion.site/image/https%3A%2F%2Fs3-us-west-2.amazonaws.com%2Fsecure.notion-static.com%2F13489b45-1d77-4996-8214-527e381a9c4e%2Flifecyclefornormal-e8a2a7e42a0722f681eb129b51e1bd66.png?table=block&id=c46ce93e-1524-4bc8-b34b-2225989d23c7&spaceId=60569f3a-f166-46d7-9825-a6cdb259b284&width=1420&userId=&cache=v2'/>

- 初始化：生产者构建并完成初始化，待发送到服务端
- 待消费：发送到服务端，对消费者可见，等待消费
- 消费中：被消费者处理，服务端会等待消费完成，如果没有收到消费者的响应，会进行重试。
- 消费提交：消费者完成消费处理，向服务端提交消费结果，服务端标记当前消息已经被处理，消费成功、失败
- 删除消息：在消息到期或存储空间不足时，将消息从物理文件中删除

发送消息时，可以设置一个key，方便查询消息轨迹。这个key最好是唯一的，比如订单编号、用户ID、Trace等。

# 延时/定时消息

**生产者设置好消息的定时时间，服务端按时投递给消费者**。一个典型的场景：用户在业务系统中发起支付，创建一笔支付单后，5分钟未付款关闭支付单。

## 注意事项

- 定时的时间是一个毫秒级 Unix 时间戳
- 必须设置在24小时范围内，超过范围不生效
- 若设置在当前时间之前，服务端将立即投递

## 生命周期

<img width='80%' src='https://silent-detective-d21.notion.site/image/https%3A%2F%2Fs3-us-west-2.amazonaws.com%2Fsecure.notion-static.com%2F7a173aeb-b3f9-414a-a8cd-890dbff7b582%2Flifecyclefordelay-2ce8278df69cd026dd11ffd27ab09a17.png?table=block&id=62387da8-21ca-4e89-aaaa-270fac739290&spaceId=60569f3a-f166-46d7-9825-a6cdb259b284&width=1420&userId=&cache=v2'/>

相比普通消息，在初始化和待消费之间，加了一个定时中的状态。服务端将延时消息单独存储，到时间以后再挪到普通消息的存储位置，暴露给消费者进行消费。

⚠️如果大量的延时消息在同一时刻触发，会造成系统压力过大、消息延迟，影响定时精度，尽量打散定时时间。

# 顺序消息

典型的应用场景：有序的事件处理、数据实时增量同步，比如用canal同步mysql的binlog至ES或其他存储介质。

<img width='80%' src='https://silent-detective-d21.notion.site/image/https%3A%2F%2Fs3-us-west-2.amazonaws.com%2Fsecure.notion-static.com%2Ffdd6664e-9e1a-4df8-80cd-94be1e076e01%2F%25E6%259C%25AA%25E5%2591%25BD%25E5%2590%258D%25E6%2596%2587%25E4%25BB%25B6.png?table=block&id=642c7b5a-3daf-4e4c-ae3e-1a956b0fd94f&spaceId=60569f3a-f166-46d7-9825-a6cdb259b284&width=1420&userId=&cache=v2'>


##### 注事事项

顺序消息的关系是通过 Message Group 识别的，生产者发送顺序消息时，需要为每条顺序消息设置 Message Group，相同 Message Group 的消息遵循 FIFO 原则。

- 必须由同一个生产者投递，且投递到同一个 Message Group 才能保障顺序性
- 必须串行发送，多线程得保证顺序投递消息，建议用最简单的方式单线程串行发送

##### 存储逻辑

相同的消息组按照先后顺序存储到同一个队列，不同消息组的消息可以混在同一个队列，但是不一定连续。

<img width='80%' src='https://silent-detective-d21.notion.site/image/https%3A%2F%2Fs3-us-west-2.amazonaws.com%2Fsecure.notion-static.com%2F06e52f53-0095-45dd-a346-209654cf591d%2Ffifomessagegroup-aad0a1b7e64089075db956c0eca0cbf4.png?table=block&id=a4c4ac4f-97dc-46c2-bf3d-26c1cfb4b242&spaceId=60569f3a-f166-46d7-9825-a6cdb259b284&width=1360&userId=&cache=v2'>

# 事务消息

分布式和微服务应用中，分布式事务是一个非常重要的组件，传统的XA事务方案资源锁定范围大、并发度低。基于普通消息很难保障一致性，因为普通消息没有协调提交、回滚的能力。而事务消息就是补充了：普通消息的二阶段提交、与本地事务绑定的能力，实现最终一致性。

<img width='80%' src='https://silent-detective-d21.notion.site/image/https%3A%2F%2Fs3-us-west-2.amazonaws.com%2Fsecure.notion-static.com%2F68e35465-7640-4913-a656-64c7d7e96d33%2Ftransflow-0b07236d124ddb814aeaf5f6b5f3f72c.png?table=block&id=f4e11d34-a0f0-42bf-92e7-8b82fabbf41d&spaceId=60569f3a-f166-46d7-9825-a6cdb259b284&width=1420&userId=&cache=v2'>

- 生产者发送消息到服务端
- 服务端将消息持久化，向生产者返回Ack，确认消息发送成功
- 此时消息被标记为"暂不能投递"，这种消息叫做**半事务消息**
- 生产者继续执行本地事务，然后向服务端发送事务结果：提交/回滚
- 服务端收到事务结果后
  + 事务提交：把半事务消息让消费者可见，让消费者成功消费
  + 事务回滚：取消投递半事务消息
  + 生产者异常：如果生产者因为宕机或者重启造成不可用，或者服务端收到的事务结果是 Unknown 等异常情况
  + 事务悬挂：为了避免生产者异常造成事务悬挂，服务端将会对生产者主动发起回查，第一次检查默认间隔 60 秒，支持自定义配置，最多不能超过1个小时
  + 事务超时：最多4个小时后超时，超时将强制回滚
  + 事务回查：生产者收到服务端的回查，要检查本地事务的执行结果，服务端根据回查结果决定要不要发消息

## 生命周期

<img width='80%' src='https://silent-detective-d21.notion.site/image/https%3A%2F%2Fs3-us-west-2.amazonaws.com%2Fsecure.notion-static.com%2Fa5e72dd0-3092-47ab-985b-24bef8465623%2Flifecyclefortrans-fe4a49f1c9fdae5d590a64546722036f.png?table=block&id=203f6835-ad1b-48c0-a41f-dc1a186ad56d&spaceId=60569f3a-f166-46d7-9825-a6cdb259b284&width=1420&userId=&cache=v2'/>

## 注意事项

事务消息只保证**本地主分支事务**和**下游消息发送事务**的一致性，不能保证消息消费结果和上游事务的一致性。所以下游服务要保证自己的分支事务正确处理，并做好消费重试机制，宕机、重启这种短暂的不可用，可以直接利用服务端的重试机制。在消息提交到下游消费端处理完成之前，下游分支和上游事务之间的状态可能会不一致。因此，**事务消息仅适合接受异步执行的事务场景**。

# 消费重试

当发生以下情况，将会触发消费重试机制：

- 网络异常造成连接失败或请求超时
- 生产者调用服务端失败或者超时，SDK会重新投递
- 服务端节点处于重启或下线等状态
- 服务端卡顿造成请求超时
- 服务端系统异常、流控

对于事务消息超时和异常不会进行重试，走回查的逻辑。触发重试会立即重试无时间间隔，如果是流控错误，将按照指数退避策略延迟重试，指数退避策略通过以下参数控制间隔：

- INITIAL_BACKOFF：第一次失败，重试需等待多久，默认1秒
- MULTIPLIER：退避倍率，默认1.6
- JITTER：随机抖动因子，默认0.2
- MAX_BACKOFF：等待间隔上限，默认120秒
- MIN_CONNECT_TIMEOUT：最短重试间隔，默认20秒

SDK内置的重试机制并不能保证消息发送一定成功，因为生产者达到重试限制后仍然发送失败，需要自己兜底处理。由于远程调用的不确定性，如果触发消息重试，可能会产生消息重复的问题，消费者也要处理好消费重复的问题，比如幂等性消费。

# 死信队列

当一条消息达到最大重试次数仍然消费失败，服务端将挪到一个特殊的队列，这个队列中的消息无法再被消费者正常消费。SDK有开启死信队列的消费API，默认3天后自动删除。

# 流控机制

- 当消费组的消费位点处于队列的最大消费位点，而某些业务又在回溯队列的历史消息，这时就会触发流控
- 消费过慢，导致队列中大量的消息堆积，超过一定数量也会触发流控，目的是减少下游消费的压力

为避免触发消息流控，可以利用可观测性功能监控系统容量等，保证资源充足。

# 消费模式

一条消息支持被多个消费组订阅，每个消费组可以初始化若干个消费者。消费者有两种模式的消费：

- 广播（Broadcast）
- 共享（Share）

<img width='80%' src='https://silent-detective-d21.notion.site/image/https%3A%2F%2Fs3-us-west-2.amazonaws.com%2Fsecure.notion-static.com%2Fb16fce1b-27a1-4dcb-9acd-94f2230a4da4%2Fconsumemode-74d53c59b3266f1f633b1392f5a0f279.png?table=block&id=f666f7bb-2c6b-45d5-a2f7-91d85e4097ce&spaceId=60569f3a-f166-46d7-9825-a6cdb259b284&width=1420&userId=&cache=v2'>

##### 广播消费

每个消费组只初始化唯一的一个消费者，多个消费组订阅这个 topic 时，每个消费者都能消费到。该方式一般可用于网关推送、配置推送、集群实例之间同步缓存等场景。

##### 共享消费

每个消费组下初始化多个消费者，这些消费者共同分担消息，1条消息只被其中1个消费者处理。可以实现消费组内流量的水平拆分和负载均衡，一般用于微服务解耦。

⚠️PushConsumer默认且仅使用消息粒度负载均衡策略，同一消费组内的多个消费者将按照消息粒度平均分摊所有消息。

<img width='80%' src='https://silent-detective-d21.notion.site/image/https%3A%2F%2Fs3-us-west-2.amazonaws.com%2Fsecure.notion-static.com%2Fc2dd9f23-3994-49a8-84e4-fdee3c4324f8%2Fclustermode-dfd781d08bc0c69111841bda537aa302.png?table=block&id=a2d115a4-8872-4cd4-83d6-40074918b3b9&spaceId=60569f3a-f166-46d7-9825-a6cdb259b284&width=1420&userId=&cache=v2'>

# 消息存储