CentOS Stream 8 常用监控工具与快速上手
一 命令行即时监控
- 进程与系统概览:top(实时进程/CPU/内存)、htop(需启用 EPEL,界面更友好,支持按键筛选/终止)。
- 内存与磁盘:free -m(以 MB 显示内存)、df -h(查看磁盘空间与挂载点)。
- CPU/内存/IO 综合:vmstat(整体资源与瓶颈定位)、iostat(磁盘读写与设备负载,来自 sysstat 包)。
- 网络与连接:ss -tuln(比 netstat 更快更现代)、iftop -i <网卡>(按连接实时带宽)、tcpdump -i <网卡>(抓包分析)。
- 历史与可视化:sar(系统活动报告,配合 sysstat 收集历史数据)、dstat(多资源并行展示)。
以上工具覆盖日常排障与性能定位的核心场景,适合快速上手与临时诊断。
二 图形化与平台化监控
- Zabbix:企业级分布式监控,支持主机/服务/网络设备的状态监测、可视化与告警。
- Prometheus + Grafana:时序数据采集与灵活可视化组合,适合动态环境与自定义看板。
- Nagios:经典告警型监控,适合传统架构与设备级可用性监控。
这些方案便于集中监控、历史趋势分析与统一告警,适合中小到大型环境落地。
三 安装与快速上手示例
- 启用 EPEL 并安装常用工具:
- 安装 EPEL:sudo dnf install epel-release -y
- 安装工具:sudo dnf install htop sysstat dstat iftop tcpdump -y
- 启动与常用用法:
- htop:htop
- 磁盘 IO:iostat -x 1 5(查看设备利用率与等待)
- 网络带宽:iftop -i eth0
- 抓包分析:tcpdump -i eth0 -nn port 80
- 历史数据采集:
- 确认 sysstat 已启用采集:sudo systemctl enable --now sysstat
- 查看历史 CPU:sar -u 1 10
以上命令覆盖从安装到常用诊断的关键步骤,便于立刻投入使用。
四 场景化组合建议
- 临时排障:用 top/htop → vmstat → iostat → ss/iftop → tcpdump 的顺序定位 CPU、内存、磁盘、网络与连接问题。
- 持续可视化与告警:部署 Prometheus + Grafana 做指标可视化与阈值告警,或用 Zabbix 快速搭建可用性与性能监控平台。
- 轻量自动化:用 cron 定期执行监控命令(如 sar、df、iostat),将结果记录到日志或发送邮件,形成低成本巡检。
上述组合能在不同规模与复杂度下取得较好的投入产出比。