2

AMD承认EPYC Rome处理器在运行1044天后会卡死,暂无修复计划

 1 year ago
source link: http://www.expreview.com/88653.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

AMD承认EPYC Rome处理器在运行1044天后会卡死,暂无修复计划

Strike发布于 2023-6-5 10:43
本文约 470 字,需 1 分钟阅读

AMD EPYC 7002是他们在2019年推出的服务器处理器,采用Zen 2架构,代号为Rome,而近日AMD发布了EPYC 7002处理器的勘误表,上面指出“在上次系统重置后大约1044天后,内核将无法退出CC6。”要解决这一问题你需要重启服务器,而且AMD已经表示不会修复这一问题。

Archer-2-2.jpg

1044天大约是34个月的时间,也就是说不到3年,而准确的时间应该是1042天12小时,出问题的可能是CPU REFCLK在54位带符号整数中计算10ns滴答,如果你计算这些滴答中的9千万亿次以上,你会在1042天12小时的时候溢出,一旦发生溢出内核就将处于卡死状态,并且不会接受任何外部中断请求,直到你把电源关闭并重启,这就能重置计算器了。

EPYC_Rome.jpg

这个问题能够被发现就表明不止一个系统练习运行了将近三年而且还没有重启,发现这个漏洞应该花了很多时间,AMD的指南中表示,导致这个问题的远呀是内核无法脱离CC6省电模式,进入该模式后会降低CPU电压和时钟频率,而不同系统出bug的时间误差可能取决于扩频调制和REFCLK频率惨况。

AMD不打算发布任何针对CC6错误的修复程序,而是建议管理员禁用CC6以避免内核卡死,或者干脆在时间期限来临前定期重启一次系统。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK