linux

如何使用Linux Trigger进行性能调优

小樊
42
2025-12-29 02:08:23
栏目: 智能运维

Linux Trigger 性能调优实战指南

一 概念澄清与总体思路

二 快速上手流程

三 常见触发器与动作示例

场景 触发条件示例 建议动作 验证指标
内存压力高 1m 内 available < 10%swap used > 5% 降低vm.swappiness=10;为关键进程设置cgroups memory.limit_in_bytes;触发日志与线程采样 availablesi/so、OOM 计数
磁盘 I/O 饱和 iostat %util > 80%await > 20ms 持续 3m 将设备调度器切换为deadline/noop;挂载加noatime;为数据库设置innodb_io_capacity;限流批处理任务 %utilawait、队列长度
连接队列溢出 **netstat -s grep -i listen** 显示丢包/溢出增长 提升net.core.somaxconnnet.ipv4.tcp_max_syn_backlog;开启tcp_tw_reuse;优化应用worker_connections
文件描述符不足 应用日志出现 Too many open files 提升ulimit -nfs.file-max;滚动重启受影响服务 进程open files、连接数
长尾延迟抖动 P95 latency > 阈值CPU steal/中断不均衡 绑定关键进程到CPU 亲和;启用RPS/RFSirqbalance优化;检查热点函数 P95/P99、调度延迟、软中断分布
上述动作涉及的系统参数与工具(如sysctl、ulimit、cgroups、iostat、ss、taskset、ethtool)均为 Linux 调优的常见手段,可结合触发器实现自动化与闭环。

四 安全与回滚要点

五 进阶与自动化

如需,我可以基于你的具体业务与指标(例如 Nginx P95、MySQL I/O、容器平台节点负载)给出可直接部署的 Prometheus 告警规则与 Webhook 动作脚本模板。

0
看了该问题的人还看了