电脑随机蓝屏,目前比较怀疑是 B850 刀锋钛主板兼容性问题(更新:已确认为 CPU 损坏)

hundund12b902b3

New member
注册
四月 27, 2025
消息
12
目前碰到的现象:电脑随机性的蓝屏,频率约在 1~2 小时一次,蓝屏代码有多达 13 种,蓝屏相关的出错软件也各不相同,基本没有规律可言(看起来一部分错误和内存出错有关)。
常规的解决方案,包括但不限于更新主板 BIOS,关闭所有的超频选项等均已经试过,无法解决蓝屏问题。
目前唯一能解决蓝屏的方案,是将除了主板、电源、显卡以外的所有硬件移到另一台机箱中,使用那台机箱、电源和机箱内的华硕 X670E ProArt 主板,正常使用三天没有蓝屏。(此测试机箱的电源不足以带动 5090,因此无法测试加上 5090 的情况)

是帮一个海外的朋友选的配置并自行组装的,配置单如下:
CPU: AMD 9950X
主板: MSI MPG B850 EDGE TI WiFi
内存: G.SKILL Trident Z5 Neo RGB Series 32G x2 6000C30(具体型号为 F5-6000J3036G32GX2-TZ5NRW)
硬盘: 海力士 P41 2T + 三星 990 EVO Plus 2T
显卡: 华硕 5090 TUF
机箱: 华硕 PA602
电源: 海韵 1300W

目前有一个尚未证明,但是体感存在的现象是,高负载场景(游戏、稳定性测试)时不发生蓝屏,反而在日常使用的正常、低负载场景容易蓝屏。
整个过程中,看各组件温度均正常,也没有 WHEA 报错。

试过如下方案,均无法解决蓝屏问题:
* 官网提供的四个版本 BIOS
* 不安装显卡,使用 9950X 的核显,最小系统(只连接了显示器和键鼠)
* 主板屏蔽核显,只使用独显(因此排除任何显卡问题的可能)
* 开启或关闭 PBO / EXPO,实测关闭任何超频选项还是会蓝屏。测试 memtest86 均能通过测试
* 单根内存安装在槽 2/4,依然会蓝屏(结合当硬件移动到另一个主板上时不会发生蓝屏,因此排除 CPU、内存、固态硬盘的可能)
* 更新芯片组和各类设备的驱动
* 调整 Windows 各类设置(GPU 硬件加速、游戏模式等)
* 调整 CPU 散热器安装压力
* 主板将“CPU 重载线校准控制”调整为 mode 1
* 关闭主板的声卡、有线网卡、无线网卡并卸载相关驱动(还发现一个 BIOS bug,在 BIOS 中关闭声卡无效,所以仅能测试在系统中禁用主板声卡,这个问题在论坛中有人反馈过)。
* 更换同型号的新一块主板

附件中提供这半个月来的蓝屏 dmp 文件(因附件上传大小限制,上传到网盘)
链接: https://pan.baidu.com/s/1ZVIHKP8cqKR1rhHjCVaImg?pwd=qyxy 提取码: qyxy

目前还没有尝试更换过的硬件为电源、主板、机箱。认知上主板的概率远大于其他两者,因为更换同型号主板无法解决蓝屏,推测为非常玄学的兼容性问题(也有可能是某些硬件的驱动,即使在不连接的情况下也会在这个主板上出问题)。

后续将尝试更换其他品牌的主板,看是否能解决蓝屏问题。如果更换主板还会蓝屏,会再尝试更换电源和重装系统。有情况会继续更新在帖子中。如果能反馈工程师,并给一些其他思路也可以尝试。
 
最后编辑:

hundund12b902b3

New member
注册
四月 27, 2025
消息
12
低负载时,才会蓝屏吗?
如果是,可以试着把Golbal C-State 关闭试试。
如果是这个引起蓝屏,看起来应该会是个比较常见的问题,但是我基本上没有搜到过相关的案例。而且它比较常见于开启 PBO 后的不稳定,另外这个也和更换同型号主板无法解决,更换另一个主板就能解决的现象也不是很符合,我也不觉得这个问题能引起多达 13 种蓝屏代码。我会尝试更改这个设定,但是我觉得它应该不能解决蓝屏问题。
 
最后编辑:

chinhuichena

Administrator
管理成员
注册
十月 16, 2014
消息
17,864
看起来真得是玄学了。
仔细看了下你的内容,发现你有两台电脑?
主板己更换过同型号一样会有问题。目前除了电源,显卡没有换过,其他的都交换过了。

可以再试试交换电源看看还会不会有问题?
 

hundund12b902b3

New member
注册
四月 27, 2025
消息
12
看起来真得是玄学了。
仔细看了下你的内容,发现你有两台电脑?
主板己更换过同型号一样会有问题。目前除了电源,显卡没有换过,其他的都交换过了。

可以再试试交换电源看看还会不会有问题?
找朋友借了兼容的硬件测试的
 

hundund12b902b3

New member
注册
四月 27, 2025
消息
12
主要是这次调整了 Global C State 之后,也是两天了才蓝屏。我们也不敢确定之前换了 ProArt 主板之后三天没蓝屏是确实不会蓝屏,还是只是运气因素。
后面只能是试试把能换的硬件都换一遍以及重装系统了。
 

chinhuichena

Administrator
管理成员
注册
十月 16, 2014
消息
17,864
软硬件都有可能会造成蓝屏的,至于是否会很多蓝屏代码,版主就不清楚了。
如果要长时间才会出问题,可能要把测试时间放长一点,再换下个设备,会保险一点。
 

hundund12b902b3

New member
注册
四月 27, 2025
消息
12
因为大量错误指向内存错误,开启了微软的 verifier 内存越界检测,经过检查几次蓝屏都没有发现驱动内存越界,排除了驱动问题后还是回到了硬件的视角。
目前更换了一个 9950X 之后,已经四天没有蓝屏。如果能持续一周以上不蓝屏应该可以确认前一次三天不蓝屏只是运气好,以及根本原因是 CPU 存在损坏(非体质差)。
 

hundund12b902b3

New member
注册
四月 27, 2025
消息
12
已经十天没有蓝屏了。可以确认为 CPU 存在问题,虽然不清楚具体到底是核心、寄存器还是内存控制器损坏。坏的 CPU 已经走质保流程,此贴终结。
 
顶部