以下是在Ubuntu上进行Kafka故障排查的常用方法:
检查服务状态
sudo systemctl status kafka # 查看Kafka服务是否运行
sudo systemctl start/stop/restart kafka # 启动/停止/重启服务
查看日志文件
/var/log/kafka/
tail -500 /var/log/kafka/server.log # 查看最新日志
cat /var/log/kafka/server.log | grep -i "error" # 筛选错误信息
验证配置文件
/etc/kafka/server.properties
listeners
、advertised.listeners
、zookeeper.connect
、log.dirs
等检查网络与端口
ping <broker-ip>
telnet <broker-ip> 9092 # 测试端口连通性
netstat -tuln | grep 9092
监控硬件资源
top # CPU/内存
df -h # 磁盘空间
iostat -x 1 10 # 磁盘I/O
使用工具辅助排查
kafkacat
查看Topic状态、发送/消费消息。处理常见问题
kafka-consumer-groups.sh
工具分析。kafka-reassign-partitions.sh
重新分配分区,或删除损坏Topic后重建。参考官方文档与社区
注:操作前建议备份配置文件和数据,避免误操作导致数据丢失。