CentOS Minimal作为精简版系统,故障排查需聚焦基础服务、日志分析、网络配置等核心环节。以下是结构化的排查流程及常见问题解决方法:
查看系统日志
日志是定位故障的“第一线索”,可通过以下命令获取关键信息:
journalctl查看系统日志(支持按服务、时间过滤):journalctl -n 100 # 查看最近100条日志
journalctl -b # 查看本次启动日志
journalctl -u sshd # 查看sshd服务日志
/var/log目录下的特定日志(如messages记录系统事件,dmesg记录内核信息):tail -f /var/log/messages # 实时跟踪系统日志
dmesg | grep -i error # 筛选内核错误信息
检查系统资源使用
资源不足(CPU、内存、磁盘)是常见故障诱因,使用以下命令排查:
top(按M排序内存,P排序CPU)free -h(查看可用内存)df -h(检查根分区及关键目录占用)df -i(避免inode耗尽导致无法创建文件)验证进程与服务状态
ps aux | grep <进程名>(如ps aux | grep nginx)systemctl status <服务名>(如systemctl status httpd)systemctl restart <服务名>(修复服务异常)测试网络连通性
ip addr show(确认IP地址、子网掩码、网关是否正确)ping www.baidu.com(验证网络是否可达)netstat -tulnp(查看监听端口,如80、443)网络配置问题
/etc/sysconfig/network-scripts/ifcfg-<接口名>,如ifcfg-ens33):vi /etc/sysconfig/network-scripts/ifcfg-ens33
确保以下参数正确:ONBOOT=yes # 开机自启
BOOTPROTO=dhcp # 或static(静态IP需配置IPADDR、NETMASK、GATEWAY、DNS1)
systemctl restart network/etc/resolv.conf,添加公共DNS(如8.8.8.8):echo "nameserver 8.8.8.8" | sudo tee /etc/resolv.conf
启动故障(无法进入系统)
e键编辑内核行;linux16或linuxefi行末尾添加single,按Ctrl+X启动。fsck检查并修复根分区(假设根分区为/dev/sda1):fsck -y /dev/sda1
grub2-install /dev/sda # /dev/sda为系统磁盘
update-grub
/etc/fstab),需将根分区重新挂载为读写模式:mount -o remount,rw /
服务无法启动
httpd、ssh)。journalctl -u <服务名>(如journalctl -u httpd),定位错误原因(如端口冲突、配置文件错误)。httpd -tnginx -tnetstat -tulnp | grep <端口号>(如80端口),终止冲突进程(kill -9 <PID>)。nmon(实时监控CPU、内存、磁盘、网络)或iotop(查看磁盘IO):yum install nmon iotop -y # 安装工具
nmon # 启动nmon(按`c`看CPU,`m`看内存)
traceroute(追踪路由路径)、tcpdump(抓包分析):traceroute www.baidu.com # 查看数据包经过的节点
tcpdump -i ens33 port 80 # 抓取80端口的流量
fsck、修改/etc/fstab等操作前,务必备份/home、/etc等关键目录。通过以上步骤,可覆盖CentOS Minimal系统80%以上的常见故障场景。若问题仍未解决,建议收集日志信息(如journalctl -b > boot.log)到技术社区(如CentOS论坛)寻求帮助。