LNMP监控体系与落地步骤
一、监控目标与分层
二、快速上手 命令行巡检与日志
三、组件关键指标与采集方式
| 组件 | 关键指标 | 采集方式 |
|---|---|---|
| Linux | CPU利用率、内存使用、swap、磁盘IO、网络吞吐、文件句柄 | top/htop、vmstat、iostat、free、df、ss |
| Nginx | 活跃/等待连接、接受/处理请求数、读/写等待、5xx/4xx 状态码 | stub_status、访问日志分析、错误日志 |
| MySQL | 连接数、慢查询数、查询缓存命中、复制延迟、线程/临时表 | mysqladmin、SHOW STATUS/PROCESSLIST、慢查询日志 |
| PHP-FPM | 进程池活跃/空闲/最大、排队请求、慢请求、请求耗时 | status_path、日志、PHP 慢日志 |
| 应用 | 关键接口P95/P99时延、错误率、吞吐 | APM(如 New Relic/Datadog)、自定义埋点 |
| 以上指标与采集方式可组合使用命令行与状态页,形成持续观测基线。 |
四、可视化与告警方案
五、自动化自愈与巡检脚本