linux

RabbitMQ Linux故障怎么排查

小樊
31
2025-12-18 16:02:37
栏目: 智能运维

RabbitMQ Linux 故障排查速查手册

一 快速定位与信息收集

二 常见故障与修复对照表

症状 快速检查 修复建议
无法连接 Broker pingtelnet 5672ss -lntp;查看 rabbit@*.log 是否拒绝连接 校正 主机名/IP/端口;开放 5672/4369/25672;检查 防火墙/安全组;确认服务运行
管理界面打不开 `ss -lntp grep 15672`;进程与端口;日志
节点启动失败 journalctl -xerabbit@*.logstartup_err 若 Erlang 崩溃(erl_crash.dump),按日志定位;若 recovery.dets 损坏,备份后删除并重启
集群节点 down/分区 cluster_status 显示 partitioned/down 统一 Erlang cookie;检查网络;按策略处理分区(如 autoheal)并重启异常节点
磁盘满/磁盘告警 df -h;日志含 disk alarm 清理无用消息/队列、扩容磁盘、降低 disk_free_limit;恢复后观察流控是否解除
内存告警/性能骤降 free -m;日志含 memory alarmlist_queues 看积压 增加消费者、启用 Lazy Queue、调高 vm_memory_high_watermark;必要时扩容内存
消息堆积/消费慢 list_queuesmessages_ready/unacknowledged 增加消费者并发、优化消费逻辑;合理设置 prefetch_count;评估持久化与镜像策略
权限/认证失败 管理界面/客户端登录失败;日志认证报错 检查 vhost用户权限、连接参数;确保凭据正确
主机名解析错误 hostname/etc/hosts 不一致;rabbitmqctl status 报错 /etc/hosts 正确映射 IP <-> 主机名;保持与节点名一致
目录权限错误 重启失败;目录属主非 rabbitmq 修正数据目录属主:chown -R rabbitmq:rabbitmq /var/lib/rabbitmq

以上检查与修复要点对应的命令与现象,可参考官方常用命令、日志路径与典型故障案例。

三 高频场景的标准修复步骤

四 日志与关键文件速查

五 预防与优化建议

0
看了该问题的人还看了