CentOS dmesg日志中常见错误有哪些
导读:CentOS dmesg 常见错误与排查要点 快速定位与查看 使用命令聚焦错误与告警:dmesg -T -l err,warn(人类可读时间、仅错误/警告);实时观察:dmesg -w;按设备/驱动过滤:dmesg | grep -i "...
CentOS dmesg 常见错误与排查要点
快速定位与查看
- 使用命令聚焦错误与告警:
dmesg -T -l err,warn(人类可读时间、仅错误/警告);实时观察:dmesg -w;按设备/驱动过滤:dmesg | grep -i "eth0\|usb\|ata\|nvme";保存现场:dmesg > dmesg_$(date +%F_%T).log。注意内核环形缓冲区在重启后会丢失,重要问题请尽快保存;同时结合journalctl -k与/var/log/messages做交叉验证。
硬件与 ACPI 错误
- ACPI 命名/方法错误:如
ACPI Error: No handler for Region [IPMI]、Method parse/execution failed [\_SB_.PMI0._GHL/_PMC]、AE_NOT_EXIST。这类多见于 BIOS/ACPI 表与内核驱动不匹配,建议升级固件、在 BIOS 中关闭未使用的设备/接口(如 IPMI/旧串口)、必要时在内核启动参数中添加acpi=off做 A/B 验证(仅测试环境)。 - 硬件错误与不可纠正介质错误:如
[Hardware Error]、ata1.00: error: { UNC }(UNC=Uncorrectable Media Error),常指向磁盘坏块/链路问题。建议立即备份、检查 SMART/厂商工具、替换可疑磁盘并复核线缆与背板。 - 找不到 PS/2 控制器:
i8042: PNP: No PS/2 controller found.在现代服务器/虚拟机中属正常提示,无需处理。
存储与文件系统错误
- SATA/NVMe I/O 异常:如
ata1.00: failed command: READ FPDMA QUEUED、res 41/40: ... Emask 0x409 (media error) < F>(UNC),或 NVMe 超时nvme nvme0: I/O 129 QID 5 timeout, reset controller。排查要点:检查磁盘健康(SMART/厂商诊断)、更新存储固件与内核/驱动、排查背板/线缆/供电、必要时调整 I/O 超时参数(如nvme_core.io_timeout)并安排维护窗口更换硬件。 - 文件系统/设备不存在:如
EXT4-fs (sda1): mount failed: No such device或ENODEV类错误,常见于设备未就绪、驱动未加载或/etc/fstab配置错误。建议核对设备名/UUID、确认模块加载、以只读方式临时挂载排查、修正 fstab 后重启。
内存与内核稳定性错误
- 内核 Oops/崩溃:如
Oops: 0002 [#1] SMP,通常伴随寄存器/调用栈信息。处置要点:保存完整dmesg与journalctl -k、开启/检查kdump生成的 vmcore、依据调用栈定位内核模块或驱动版本问题,升级或回退相关组件。 - 内存不足/被 OOM Killer 终止:如
Out of memory: Kill process 1234 (java) score 989 or sacrifice child,或dmesg | grep -i "kill"能看到进程被杀死。建议分析内存占用与增长路径、限制应用内存、优化缓存/参数、增加物理内存或启用 swap(视业务而定)。 - 硬件错误记录:如
[Hardware Error]与mcelog关联条目,可能指向内存/CPU 硬件故障。建议收集mcelog/EDAC日志、运行内存压力/置换测试、必要时更换内存条或主板插槽并联系厂商支持。
网络相关错误
- 网卡链路与看门狗超时:如
NETDEV WATCHDOG: eth1: transmit timed out、eth1: link down/up、eth0: Transmit error, Tx status register 82(常见于双工不匹配)。排查要点:检查网线/光模块/交换机端口、强制设定速率/双工一致、更新网卡驱动、排查中断/队列/流量异常。 - 邻居表溢出:如
Neighbour table overflow,多见于局域网异常(ARP 风暴/病毒)。建议抓包定位异常源、清理 ARP 表、隔离问题主机并检查交换网络健康。 - 校验和与协议错误:如
UDP: bad checksum、ICMP: failed checksum、NET: N messages suppressed、__ratelimit: N messages suppressed。通常来自畸形/攻击流量,少量可忽略;若持续大量出现需联动安全团队与上游网络设备处置。
声明:本文内容由网友自发贡献,本站不承担相应法律责任。对本内容有异议或投诉,请联系2913721942#qq.com核实处理,我们将尽快回复您,谢谢合作!
若转载请注明出处: CentOS dmesg日志中常见错误有哪些
本文地址: https://pptw.com/jishu/772390.html
