Debian 通过 CPUInfo 进行故障排查
一、快速定位 CPU 相关症状
二、常见症状与 CPUInfo 检查要点
| 症状 | 优先检查 | 判定要点 | 建议操作 |
|---|---|---|---|
| 新装机/升级后 CPU 型号不对 | model name、cpu family、model | 与采购清单或云厂商规格不一致 | 核对主板/BIOS 设置、虚拟机配置;必要时更新 BIOS/微码 |
| 核心/线程数不符 | processor、cpu cores、siblings、physical id、lscpu | 逻辑处理器数≠物理核心×每核线程数,或插槽数异常 | 检查 BIOS 中超线程/SMT、NUMA 设置;排查虚拟机 CPU 拓扑分配 |
| 频率忽高忽低或达不到标称 | cpu MHz、scaling_governor(需 cpufreq) | 频繁升降频、策略为 powersave | 切换为 performance 或按需调优;检查散热与电源策略 |
| 程序报非法指令/依赖 CPU 特性 | flags | 缺少所需指令集(如 sse4_2、avx2) | 更换具备该特性的实例/硬件,或重编译启用合适目标 |
| 虚拟机性能异常 | lscpu 的 Hypervisor vendor、Virtualization type | 显示为 KVM/QEMU 且特性受限 | 调整 VM CPU 模型/特性直通;升级宿主机与虚拟化驱动 |
| 偶发重启/关机 | dmesg 的 thermal、mce、acpi | 温度阈值、MCE 硬件错误、ACPI 事件 | 检查散热、清灰、更换导热材料;更新微码与 BIOS;分析 MCE |
| 系统负载高但 CPU 占用低 | vmstat 的 r、b、in | r 队列长、in 中断高 | 查中断来源(网卡、磁盘、驱动);定位设备/驱动问题 |
| 表中要点均可通过 /proc/cpuinfo、lscpu 与内核日志交叉验证,先确认“硬件与拓扑是否正确”,再判断“运行策略与温度是否异常”,最后落到“驱动与内核事件”。 |
三、关键命令与字段速查
四、标准化排查流程