http://<namenode-ip>:50070
查看HDFS状态。http://<resourcemanager-ip>:8088
监控资源分配和任务执行。hdfs dfsadmin -report
:查看DataNode状态和HDFS健康状况。yarn node -list
:查看NodeManager节点状态。jps
:查看Hadoop进程是否正常运行。$HADOOP_HOME/logs
),使用tail -f
或grep
定位异常。编写脚本定期采集指标(如CPU、内存、磁盘使用率),输出到日志或监控系统,例如:
#!/bin/bash
echo "HDFS状态: $(hdfs dfsadmin -report | grep 'Live datanodes')" >> /var/log/hadoop_monitor.log
echo "YARN节点: $(yarn node -list)" >> /var/log/hadoop_monitor.log