Linux CPU故障排查可按以下步骤进行:
查看CPU信息
cat /proc/cpuinfo 或 lscpu 命令检查CPU型号、核心数、频率、缓存等是否正常。uname -r 查看内核版本并更新。监控CPU使用率
top/htop 实时查看CPU占用情况,定位高负载进程(重点关注 us 用户态、sy 内核态使用率)。vmstat/mpstat 分析CPU整体负载及多核使用均衡性。检查硬件状态
dmesg 或 journalctl 查看系统日志,排查CPU相关错误(如过热、硬件故障)。lm-sensors 监控CPU温度,判断是否因散热问题导致异常。dmidecode 获取硬件配置,或通过 lshw/hwinfo 检测CPU状态。分析内核与驱动
modinfo 确认模块状态。其他高级排查
perf 工具分析进程行为,或用 memtest86+ 检测CPU硬件故障。参考来源: