linux系统宕机看什么日志
linux系统宕机看什么日志详细介绍
在 Linux 系统宕机(崩溃或无响应)时,排查问题的关键是分析系统日志,以下是需要重点查看的日志和工具:
一、核心系统日志
1.
/var/log/messages(通用系统日志)
- 作用:记录系统启动、硬件、服务等关键事件(如内核消息、进程异常、驱动问题),是排查宕机的核心日志。
- 注意:部分发行版(如 Debian/Ubuntu)可能使用
/var/log/syslog替代。
2.
/var/log/kern.log(内核日志)
- 作用:专门记录内核相关的消息(如硬件错误、内存分配失败、驱动异常)。宕机可能由内核崩溃(Oops)或硬件问题导致,这里会有直接线索。
- 示例:若日志中出现
Kernel panic(内核恐慌),说明内核因严重错误终止系统。
3.
dmesg(内核环缓冲日志)
- 作用:查看系统启动后内核输出的实时日志(包括硬件检测、驱动加载、内存 / IO 错误等),宕机时的硬件问题(如磁盘故障、PCIe 错误)会在此显示。
- 使用方式:bash
二、系统服务与进程日志
1.
/var/log/systemd/journal/(systemd 日志)
- 作用:systemd 管理的现代 Linux 系统(如 CentOS 7+/Ubuntu 16.04+)会将日志存储在此目录(需启用持久化)。通过
journalctl命令可灵活查询。 - 常用命令:bash
journalctljournalctl -3
2. 应用程序自定义日志
- 作用:若宕机由特定服务(如数据库、Web 服务器)崩溃导致,需检查其自定义日志。例如:
- Nginx:
/var/log/nginx/error.log - MySQL:
/var/log/mysql/error.log - Apache:
/var/log/httpd/error_log(CentOS)或/var/log/apache2/error.log(Ubuntu)
- Nginx:
三、硬件与资源相关日志
1. 内存不足(OOM)日志
- 原因:系统内存耗尽时,OOM(Out Of Memory)杀手会强制终止进程,可能导致系统崩溃。
- 查看方式:bash
/var/log/messages/var/log/messages
2. 硬件错误日志
- 磁盘问题:检查
/var/log/messages或dmesg中是否有sdX(SCSI/SATA 磁盘)或nvmeX(NVMe 磁盘)的错误(如I/O error、unrecoverable error)。 - CPU / 内存错误:通过
dmesg查看是否有mce(Machine Check Exception,硬件错误)相关日志,可能由硬件损坏导致。
四、排查步骤建议
- 确定宕机时间:通过
last reboot查看系统最近一次启动时间,缩小日志排查范围。 - 优先检查内核日志:
dmesg和/var/log/kern.log是定位硬件或内核问题的关键。 - 筛选错误级别日志:使用
grep "error\|fail\|panic"过滤日志中的错误关键词。 - 结合系统资源监控:若有
sar、top等工具的历史记录,可分析宕机前 CPU / 内存 / IO 使用率是否异常。
通过以上日志的综合分析,通常能定位宕机的根本原因(如硬件故障、内核崩溃、进程 OOM、服务死锁等)。