活动回顾|RocketMQ 运维经验圆桌交流「第二期」

原创
02/20 10:38
阅读数 22

2023年12月3日,AutoMQ 举办了第二场线上交流会 RocketMQ 运维经验圆桌交流「第二期」,本次交流会汇聚了 RocketMQ 的作者以及来自腾讯云、网易、社区的技术专家。在这个充满交流热情的活动中, 大家共同探讨了 RocketMQ 的运维经验,分享了宝贵的见解。接下来让我们一起回顾此次 RocketMQ 运维学习之旅!

从用户堆积问题看RocketMQ可观测的实现

腾讯云 RocketMQ 技术专家李伟老师分享了在解决堆积问题时的经验分析方法,包括根据经验快速定位问题、利用监控指标进行分析、巡检链路的建立等。他还总结了将运维经验沉淀下来的方法,包括个人记录、标准化操作文档、工具化和页面白屏化的发展。最后,他简要介绍了RocketMQ 5 的可观测指标实现方式,并指导大家如何查找和理解这些指标。

RocketMQ 运维稳定性与可观测性关联分析

网易云消息中间件研发负责人林德智老师分享了在工作中遇到的 RocketMQ 相关问题和解决方法。重点包括消费常见问题的一些定位,解析了消费失败、消费延迟、消费耗时长等情况。他介绍了通过精准采样和消息轨迹解决难题的方法,讨论了扩缩容导致消费负载不均衡的情况并一一给出解法,强调了合理设置 queue 数量的重要性。

学习 RocketMQ 的精髓:知行合一

架构师张勇老师分享了他学习 RocketMQ 四个阶段的经历。第一阶段,RocketMQ 刚开源,他就用它推动重构了同程艺龙的优惠券计算服务,大大优化计算时间。第二阶段,他自己写了两个轮子,包括分库分表组件和 RPC 框架。第三阶段,他开始在生产环境中实战应用 RocketMQ ,介绍了电商直播答题和自研任务调度系统两个场景的应用经验。第四阶段,他将 RocketMQ 知识体系串联并输出成文章,同时他从书籍、公众号、大厂实战文章等很多渠道去学习。最后他总结道,学习任何一门技术,都应该做到知行合一,强调理论学习和动手实践的重要性。

RocketMQ 部署、应用、诊断

AutoMQ 联合创始人 & CTO 周新宇老师围绕“如何运上部署高可用的 RocketMQ 集群”“PushConsumer 最佳实践是什么”“用户说消息未消费怎么排查”三个议题,给大家深入讲解了 RocketMQ 部署、使用、诊断三个方面,并提出了以下重点建议:

在云上部署高可用集群,推荐使用 GitOps 的配置管理方案,比如将配置文件放在 GitHub 上进行管理。

在部署时拆分小集群,通过小集群分级管理业务,以控制故障半径。

在故障发生时,快速止血是第一优先级,使用 RocketMQ 的管理工具进行快速的禁读禁写,以隔离故障。

在 PushConsumer 的应用中,要注意避免误用消费重试的能力,避免将任何错误都进行重投,尤其是限流错误,建议阻塞并在服务端堆积消息。

在诊断消息未消费问题时,需要多路径进行排查,包括检查消费轨迹、消息状态、投递条件、定时消息等,注意客户端配置和历史变更。

RocketMQ Copilot 自助诊断功能

Apache RocketMQ PMC Member 艾阳坤老师演示了 RocketMQ Copilot 产品的针对于消息堆积的自助诊断的过程。在周新宇老师提到的消息未消费问题上,他也使用 RocketMQ Copilot 产品的自助诊断功能进行了演示,只需要填入 Topic,ConsumerGroup 和 MessageId 等信息,RocketMQ Copilot 就可以根据这些元数据和线上信息还原现场,根据消息未消费的知识图谱依次排查,并最终定位出问题的根因。

欢迎大家访问 https://play.automq.com 进行 RocketMQ Copilot 的体验。

线上互动交流

线上参会的小伙伴的学习热情满满,积极与专家展开了深入交流,连线讨论了RocketMQ消息积压、消费延迟、缩容的时候发送顺序消息等问题。专家们对各个问题都进行了深度剖析和详细解答,为大家答疑解惑。

最后,再次感谢各位讲师的精彩分享,也感谢每一位参会者的支持!我们下期见!

资源分享

关注“ AutoMQ ”公众号并发送 “圆桌交流第二期” ,即可获得本次活动相关 PPT 下载地址。

会议录屏后续将会发送在“ AutoMQ ”视频号和 “ AutoMQ 官方账号 ” B站账号,请大家持续关注! END

关于我们

AutoMQ 是一家专业的消息队列和流存储软件服务供应商。AutoMQ 开源的 AutoMQ Kafka 和 AutoMQ RocketMQ 基于云对 Apache Kafka、Apache RocketMQ 消息引擎进行重新设计与实现,在充分利用云上的竞价实例、对象存储等服务的基础上,兑现了云设施的规模化红利,带来了下一代更稳定、高效的消息引擎。此外,AutoMQ 推出的 RocketMQ Copilot 专家系统也重新定义了 RocketMQ 消息运维的新范式,赋能消息运维人员更好的管理消息集群。 

🌟 GitHub 地址:https://github.com/AutoMQ/automq-for-kafka

💻 官网:https://www.automq.com

👀 B站:AutoMQ官方账号

🔍 视频号:AutoMQ 

👉 扫二维码加入我们的社区群

关注我们,一起学习更多云原生干货

展开阅读全文
加载中
点击引领话题📣 发布并加入讨论🔥
打赏
0 评论
0 收藏
0
分享
返回顶部
顶部