centos

CentOS Minimal系统故障排查方法

小樊
45
2025-09-30 12:22:18
栏目: 智能运维

CentOS Minimal系统故障排查方法

一、基本排查步骤

  1. 确定故障类型
    首先区分故障范围:硬件问题(如硬盘损坏、内存故障)、软件问题(如服务崩溃、配置错误)、网络问题(如无法连接、DNS解析失败)。明确类型后可针对性缩小排查范围。

  2. 查看系统日志
    日志是故障排查的核心工具,可通过以下命令获取关键信息:

    • 使用journalctl查看系统日志(支持过滤关键字,如journalctl -n 100查看最近100条日志,journalctl -b查看启动日志,journalctl grep 'error'搜索错误信息);
    • 检查/var/log目录下的细分日志(如/var/log/messages系统日志、/var/log/dmesg内核日志、/var/log/httpd/error_log Apache错误日志)。
  3. 检查进程与服务状态

    • 使用ps aux查看所有进程的CPU、内存占用及运行状态,识别异常进程(如占用过高资源的进程);
    • 使用systemctl status <服务名>(如systemctl status httpd)检查服务是否运行正常,若未运行可使用systemctl start <服务名>启动。
  4. 检查系统资源使用

    • 使用tophtop查看CPU、内存实时占用情况,识别资源瓶颈;
    • 使用free -h查看内存及交换分区使用情况;
    • 使用df -h查看磁盘空间(重点关注根分区/的使用率,避免因空间不足导致系统故障);
    • 使用df -i查看inode使用情况(若inode耗尽,即使磁盘空间充足也无法创建文件)。
  5. 检查配置文件
    常见配置文件需重点核查:

    • 网络配置文件(/etc/sysconfig/network-scripts/ifcfg-eth0/etc/NetworkManager/system-connections/下的文件):确保ONBOOT=yes(开机自启)、BOOTPROTO(dhcp/static)配置正确;
    • 分区挂载配置文件(/etc/fstab):确保分区UUID或设备名正确,避免启动时挂载失败;
    • 服务配置文件(如/etc/httpd/conf/httpd.conf):检查语法错误(可使用apachectl configtest验证)。

二、常见故障及解决方案

1. 网络连接问题
2. 服务无法启动
3. 系统无法启动

三、常用故障排查工具

0
看了该问题的人还看了