在Debian上管理Hadoop日志可参考以下方法:
日志文件位置
logs
文件夹,可通过hadoop-env.sh
中HADOOP_LOG_DIR
配置自定义路径。/tmp/logs
目录,可通过yarn-site.xml
配置yarn.nodemanager.remote-app-log-dir
修改。查看日志
journalctl
命令(如journalctl -u hadoop
查看特定服务日志)。cat
、less
、grep
等命令直接查看日志文件。日志聚合
yarn-site.xml
中启用yarn.log-aggregation-enable=true
,并设置保留时间(如yarn.log-aggregation.retain-seconds=172800
,单位为秒)。日志轮转与清理
logrotate
工具配置日志轮转、压缩和删除策略,避免日志占满磁盘。高级分析
日志级别调整
log4j.properties
文件(路径:$HADOOP_HOME/etc/hadoop/
),设置log4j.rootLogger
等级(如DEBUG
、ERROR
),修改后重启Hadoop服务生效。