top、htop、vmstat、iostat 等工具监控CPU、内存、磁盘I/O等系统资源使用情况。df -h 查看Overlay文件系统(lowerdir/upperdir/workdir)的磁盘空间占用。mount | grep overlay 查看Overlay文件系统挂载状态。inotifywait 监控挂载点的文件创建、删除等事件,需先安装 inotify-tools。docker network ls 查看Overlay网络状态,docker service ls 监控服务状态。nethogs 或 iftop 监控网络流量,排查网络异常。rsyslog + mmexternal 模块,基于日志级别(如ERROR)触发邮件告警,需编辑 /etc/rsyslog.conf 并重启服务。logwatch 定期分析日志,设置异常日志的邮件通知规则。#!/bin/bash
THRESHOLD=80
EMAIL="your_email@example.com"
CPU_USAGE=$(top -bn1 | grep "Cpu(s)" | sed "s/.*, *\([0-9.]*\)%* id./\1/")
if (( $(echo "$CPU_USAGE > $THRESHOLD" | bc -l) )); then
echo "CPU使用率超过阈值: $CPU_USAGE%" | mail -s "CPU告警" $EMAIL
fi
可扩展至监控磁盘空间、网络延迟等场景。Prometheus + Grafana,通过插件监控OverlayFS性能指标(如IOPS、延迟),并设置告警规则。Skydive 等网络监控工具,对Overlay网络拓扑和流量异常进行告警。lowerdir/upperdir 的冗余数据,避免磁盘空间不足。