linux

Linux下Hadoop性能如何监控

小樊
42
2025-12-16 14:13:29
栏目: 智能运维

Linux下Hadoop性能监控实践

一 监控体系与工具选型

二 关键监控指标与查看方法

维度 关键指标 主要查看方式
HDFS Capacity/Used/RemainingMissing/Under-Replicated BlocksDataNode 数量与存活块报告延迟 NameNode UI(50070/9870)hdfs dfsadmin -reporthdfs fsck
YARN 集群/队列资源使用(Memory/VCores)、NodeManager 健康应用与容器状态 ResourceManager UI(8088)yarn node -list -allyarn application -list
作业 Map/Reduce 进度失败/重试次数任务运行时间 ResourceManager UImapred job -list
JVM/主机 GC 次数/时间堆内存CPU/内存/磁盘 IO/网络 JMX(JConsole/VisualVM)、Ganglia/ZabbixLinux sar/pidstat
日志 异常/错误/慢操作 $HADOOP_HOME/logstail/grep日志聚合

三 快速落地步骤 Prometheus Grafana

四 告警与日志最佳实践

五 常见问题排查路径

0
看了该问题的人还看了