debian

Debian环境下Kafka如何进行故障排查

小樊
33
2025-12-29 21:26:02
栏目: 智能运维

Debian环境下Kafka故障排查清单

一 快速定位流程

二 systemd 启动失败专项排查

三 常见错误与修复对照表

症状 快速检查 修复建议
服务启动即停或反复重启 journalctl 报错、server.log 无持续输出 检查单元文件 Type/依赖/重启策略;确认脚本前台/后台行为与 Type 一致
Fatal error during KafkaServer startup server.log 堆栈、配置与目录权限 核对 server.properties(listeners/advertised.listeners/zookeeper.connect/log.dirs)、目录权限与可用空间
端口 9092 无法访问 netstat/lsof 显示被占用或防火墙拦截 释放占用端口或调整 listeners;放行防火墙 sudo ufw allow 9092/tcp
无法列出主题或生产/消费失败 9092 连通性、ZooKeeper 状态 测试 ping/traceroute、检查 ZooKeeper 运行、用 CLI 最小验证
磁盘写满或 I/O 报错 df -h、iostat、server.log 的 I/O 错误 清理或扩容数据盘;优化保留策略;必要时迁移至更高 IOPS 的磁盘
频繁 GC 或 OOM GC 日志、free/ulimit 调整 -Xmx/-Xms 与 GC 策略;提升 LimitNOFILE 与系统内存;排查内存泄漏
高延迟/吞吐低 iostat、网络带宽、分区数 启用压缩(如 compression.type=gzip)、增大批量(batch.size/linger.ms)、优化分区数与磁盘/网络

以上对照表覆盖了启动、网络、磁盘、JVM 与性能等高频问题及处置路径。

四 性能与容量瓶颈定位

0
看了该问题的人还看了