在Debian上管理Hadoop日志可参考以下方法:
日志文件位置
logs文件夹,可通过hadoop-env.sh中HADOOP_LOG_DIR配置自定义路径。/tmp/logs目录,可通过yarn-site.xml配置yarn.nodemanager.remote-app-log-dir修改。查看日志
journalctl命令(如journalctl -u hadoop查看特定服务日志)。cat、less、grep等命令直接查看日志文件。日志聚合
yarn-site.xml中启用yarn.log-aggregation-enable=true,并设置保留时间(如yarn.log-aggregation.retain-seconds=172800,单位为秒)。日志轮转与清理
logrotate工具配置日志轮转、压缩和删除策略,避免日志占满磁盘。高级分析
日志级别调整
log4j.properties文件(路径:$HADOOP_HOME/etc/hadoop/),设置log4j.rootLogger等级(如DEBUG、ERROR),修改后重启Hadoop服务生效。