Debian日志中的常见性能监控指标分类及具体内容
通过/var/log/dmesg(内核环形缓冲区日志)和/var/log/syslog(系统通用日志)记录,包含系统启动时间、硬件初始化(如CPU、内存、磁盘检测)结果、内核模块加载状态(如驱动程序是否正常加载)及系统运行中的关键事件(如服务启动/停止)。这些指标可反映系统启动效率及基础硬件的兼容性。
/var/log/syslog或/var/log/kern.log中记录的I/O error、disk failure等关键词,提示硬盘坏道、连接松动等问题;/var/log/syslog中的Out of memory (OOM)错误(内存耗尽触发内核杀死进程)、Memory corruption(内存损坏)等,反映内存硬件或驱动问题;/var/log/syslog中CPU usage limit exceeded(CPU使用率超过阈值)或内核日志中的soft lockup(CPU锁死)等,提示CPU资源瓶颈。通过/var/log/syslog或各应用专用日志(如/var/log/apache2/error.log、/var/log/mysql/error.log)记录,包含服务的启动/停止时间、运行状态(如active (running)/inactive (dead))、错误信息(如Failed to start Apache)。这些指标可评估应用的可用性及服务依赖关系是否正常。
通过/var/log/auth.log记录,包含用户登录尝试次数(成功/失败)、登录延迟(如sshd服务的connection accepted时间戳)、认证失败原因(如invalid password、account locked)。频繁的认证失败可能导致服务响应变慢,需警惕暴力破解攻击。
/var/log/syslog或/var/log/kern.log中记录的high CPU usage警告、kworker(内核工作线程)占用过高、fork: Cannot allocate memory(进程创建失败,因CPU资源不足)。可通过top、htop命令实时补充验证。
/var/log/syslog中vmalloc失败、Out of memory(OOM) killer触发(如Killed process X (apache2), UID Y, total-vm:ZkB, resident-set-size:WkB);/var/log/syslog中swappiness值过高(如vm.swappiness=60)或swap usage exceeded警告,提示物理内存不足。/var/log/syslog或/var/log/kern.log中的I/O wait(CPU等待磁盘I/O的时间过长)、sdX: I/O error(磁盘读写错误);/var/log/syslog中Disk space low(如/dev/sda1 is 95% full)或df命令输出的Use%接近100%,导致应用无法写入数据。/var/log/syslog或/var/log/kern.log中的TCP retransmit(TCP重传,提示网络丢包)、ICMP echo request timeout(ping超时);/var/log/syslog中的network congestion(网络拥塞)、interface X dropped packets(网卡丢包),可通过iftop、nload补充监控。各应用专用日志(如/var/log/apache2/error.log中的[error]、/var/log/mysql/error.log中的ERROR)记录的数据库死锁、查询超时、应用崩溃(如Segmentation fault)等信息,直接影响用户体验。
部分应用会在日志中记录性能指标(如Apache的access.log中的%D字段表示请求处理时间、%b表示响应大小;Nginx的status模块中的active connections、requests per second)。这些指标可反映应用的吞吐量及响应效率。
通过/var/log/syslog、/var/log/kern.log等日志文件的大小变化及logrotate配置(如/etc/logrotate.conf中的size、rotate参数),监控日志文件的增长速度、轮转频率及压缩情况。过大的日志文件会占用磁盘空间,影响系统性能。
通过journalctl(systemd日志管理工具)的--disk-usage选项查看日志占用的磁盘空间,或/var/log/journal目录的大小。过多的日志记录(如日志级别设置为DEBUG)会增加I/O负载,需调整日志级别(如改为INFO)。