Linux故障分析与排错

一、系统故障分析方法和目标1.1、系统故障分析a) 判断问题的性质b) 重演出错过程c) 查找进一步信息d) 从简单的的方法入手e) 在修改的时候备份配置文件f) 修复Linux系统不同阶段的故障g) 将系统引导到不同的运行级别h) 使用救援模式1.2、应用故障分析的方法: a) 描绘问题的特征b) 发现全部信息c) 查找可能的原因d) 首先尝试容易的事情e) 配置文件:修改前要备份,使用可用的工具f) 重现这个问题1.3、有用的命令:a) History,b) grep, less /var/log/messages|greperrorc) diff, difffile1file2d) find/目录-cmin -60 查找60分钟以内被修改过的文件e) Stracecommandf) Tail-flogfile1.4、X服务的故障a) 不要在runlevel 5级别下进行X服务的排错b) 当改变了硬件时,先尝试使用命令:system-config-displayc) 使用命令:X-probeonlyd) 查看/home与/tmp空间是否还有剩余,或者使用者是否达到磁盘限额1.5、Selinux服务的故障a) 日志帮助工具:setroubleshootd 与 sealert-bb) /var/log/messagesc) /var/log/audit/audit.logd) 查看帮助手册,比如:httpd_selinux,samba_selinux,ftpd_selinux等等e) 策略改变f) System-config-selinuxg) Setenforceh) Setsebooli) Semanage1.6、Networking的故障a) 主机名的解析,dig server1.example.comb) ip地址的配置,ifconfig,netconfig,setup,/etc/sysconfig/network-scripts/ifcfg-eth0c) 默认网关与路由,查看网关路由:route-n或者 iprd) 模块的详细说明e) 激活设备1.7、Boot process的故障a) bootloader configurationb) kernelc) /sbin/init startinginitd) /etc/rc.d/rc.sysinite) /etc/rc.d/rc, /etc/rc.d/rc?.d/进入runlevel 级别f) /etc/rc.d/rc.localg) 虚拟控制台h) Xdisplay manager1.8、rpm数据库损坏故障原因:a) 非正常关机、误删除运行中的程序文件b) RPM数据文件被误写或删除故障现象:a) 不能正常查询rpm包信息 rpm -ql ; rpm -qa …..b) 无法安装、升级或卸载软件包等 rpm -U ; rpm -i……c) 解决方案:d) 重建RPM数据库e) 重建命令:rpm –rebuilddb 或 rpm –initdb1.9、磁盘资源耗尽故障故障原因:a) 磁盘空间已被大量的数据占满,空间耗尽b) 虽然还有可用空间,但文件数i节点耗尽故障现象:a) 无法写入新的文件,提示“… : 设备上没有空间”b) 部分程序无法运行,甚至系统无法启动解决方案:a) 清理磁盘空间,删除无用、冗余的文件b) 转移或删除占用大量i节点的琐碎文件c) 进 入单用户模式、急救模式进行修复d) 用户设置磁盘配额—系统管理中必做的

排错实例文档下载:http://down.51cto.com/data/509260

IT-爱好者

转动心中的期待,血在澎湃,吃苦流汗算什么。

Linux故障分析与排错

相关文章:

你感兴趣的文章:

标签云: