Linux Kafka监控可通过以下方式实现:
一、工具监控
-
Kafka自带命令行工具
kafka-topics.sh:查看主题详情。
kafka-consumer-groups.sh:监控消费者组状态(消费延迟、堆积量等)。
kafka-run-class.sh:测试生产/消费者性能指标。
-
第三方工具
- Prometheus + Grafana:通过JMX Exporter采集Kafka指标,Grafana可视化并设置告警(如消息堆积、延迟超限)。
- Burrow:专注消费者偏移量监控,检测延迟和堆积。
- Kafka Manager(CMAK):提供集群状态、主题/分区管理及监控界面。
- Confluent Control Center:商业级工具,支持集中化监控与告警。
-
系统级监控
- 使用
top/htop、iostat、vmstat等工具监控服务器CPU、内存、磁盘I/O等基础指标。
二、关键监控指标
- Broker:吞吐量、延迟、磁盘使用率、网络连接数、ISR副本数。
- Topic/Partition:消息入出速率、堆积量、日志刷新延迟。
- 消费者:消费速率、延迟、偏移量提交情况。
三、配置建议
- 启用JMX监控(设置
JMX_PORT环境变量)。
- 定期清理日志,避免磁盘占满(通过
log.retention.hours配置)。
- 根据负载调整分区数和副本数,确保高可用性。
以上工具和方法可组合使用,实现对Kafka集群的全面监控。