Hadoop日志默认存放在$HADOOP_HOME/logs目录下,常见文件包括:
hadoop-hdfs-namenode-<hostname>.log、hadoop-hdfs-datanode-<hostname>.logyarn-hadoop-resourcemanager-<hostname>.log、yarn-hadoop-nodemanager-<hostname>.logjobhistory服务查看,路径可在yarn-site.xml中配置| 命令 | 用途 | 示例 |
|---|---|---|
| tail -f | 实时查看日志末尾内容,适合监控实时日志 | tail -f hadoop-hdfs-namenode-*.log |
| head -n | 查看日志前N行,快速定位头部信息 | head -n 50 hadoop-hdfs-datanode-*.log |
| grep | 搜索特定关键词(如错误信息),支持正则表达式 | grep "ERROR" hadoop-*.loggrep -i "exception" yarn-*.log |
| less/ more | 分页查看大日志文件,支持上下翻页、搜索 | less hadoop-*.logmore /var/log/syslog |
| cat | 查看完整日志文件(仅适合小文件,大文件可能导致终端卡顿) | cat hadoop-hdfs-namenode-*.log |
| awk/sed | 高级文本处理,如提取特定字段、统计行数 | awk '{print $1, $3}' hadoop-*.logsed -n '100,200p' yarn-*.log |
http://<主机>:8088或http://<主机>:50070访问,查看作业日志和集群状态。yarn-*.log.20250815),需注意路径中的日期格式。