旧主板-新Nvme-IO问题
m2硬盘安装ubuntu出现I/O错误: DMAR fault的排查记录(含解决方案) 在旧台式机安装Ubuntu24.04 的过程中,我遇到一个非常棘手的问题: 第一次安装失败; 安装过程中, 提示io错误 关机后, 再次安装, 安装成功 进入系统后, 硬盘灯持续规律闪烁, 频繁出现 I/O 错误、系统卡顿、硬盘灯间隔性闪烁、并伴随 DMAR/IOMMU 报错 最开始遇到这个问题, 我以为是硬盘问题, 更换为 sata硬盘后, 问题消失。似乎从某种程序上证明是此硬盘问题; 随后此”坏硬盘“, 就安静的放在角落; 今天整理物品, 发现这块硬盘, 突然想到, 让ai帮忙分析分析硬盘是什么原因导致的故障, 以后如何避免买到类似的硬盘; 这篇文章记录整个排查过程,希望给未来遇到类似问题的人提供一个可参考的解决思路。 1. 硬件与环境背景 主板:Gigabyte Z97X-UD3H(2014年) CPU:Intel i7-4790K(Haswell) NVMe:YMTC PC300 512GB(支持 HMB,NVMe1.4) 系统:Ubuntu 24.04 NVMe 安装在主析的m2硬盘槽位 这是典型的“老主板 + 新 NVMe 控制器”的组合,在 Linux 下非常容易触发兼容性问题。 2. 问题现象 (1)安装 Ubuntu 时随机 I/O 错误 系统安装过程中文件复制中断 安装流程偶尔直接失败 重试偶尔能安装成功 (2)安装成功后,进入系统, 硬盘灯持续规律闪烁 开机后系统明显不顺畅。 复制文件时,会出现卡顿, 此时硬盘灯一直有规律的闪烁; (3)复制大文件(如 ubuntu.iso 6GB)出现卡顿 传输速度会突然降到零,直到系统无响应。 (4)dmesg 出现 DMAR/IOMMU 报错 DMAR: DRHD: handling fault status reg 2 DMAR: [DMA Write] Request device [01:00.0] fault addr ... DMAR: write no_pasid (5) 硬盘smart 检测无异常 使用 smartctl 读取 NVMe 健康状态: smartctl -x /dev/nvme0 ...