4

英特尔持续对锐炫显卡驱动优化,底层优化让DX11性能暴涨19%

 1 year ago
source link: http://www.expreview.com/89713.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

英特尔持续对锐炫显卡驱动优化,底层优化让DX11性能暴涨19%

Strike发布于 2023-8-18 21:13

本文约 1890 字、11 张图表,需 4 分钟阅读

去年英特尔锐炫台式机产品发布时,我们承诺过英特尔锐炫显卡会持续优化升级,带来更出色的体验,实际上他们也做到了,前段时间我们测试过使用当时最先驱动后性能要比首发驱动有提升,特别是DX9游戏的提升非常明显。现在英特尔锐炫正式推出DirectX 11驱动更新,为PC游戏玩家带来更强劲性能,体验更流畅,正如今年年初DX9游戏获得重要提升一样。

ARC_01.jpg

通过最新Game On驱动的发布,英特尔提升了英特尔锐炫显卡在运行一系列备受欢迎的 DX11 游戏的性能——为游戏玩家带来平均约19%的帧率提升,平均约20%的99th Percentile帧率流畅度提升。对于拥有英特尔锐炫A750显卡的用户,可以直接下载最新驱动,在《守望先锋 2》、《DOTA 2》、《Apex Legends》等游戏中获得体验升级。

ARC_02.jpg

这是尔锐炫A750搭配酷睿i5-13400平台的测试成绩,可见与首发的3490版本驱动相比,最新的4644版本驱动在1080p下运行多款DX11游戏平均帧率都有了明显的提升。

ARC_03.jpg

换成提升幅度是这样的,涨幅从5%到33%不等,平均下来涨幅有19%

ARC_04.jpg

如果把CPU从主流级的酷睿i5换成旗舰级的酷睿i9-13900K的话涨幅其实没那么多,平均约为12%左右,造成这样的原因是什么呢?

英特尔过去一直有集成显卡的历史,而在那时总是受限于GPU,所以英特尔的驱动程序的某些架构基本上是建立在“我有无限的CPU资源,因为无论如何,我的瓶颈总是在GPU上”的模式上。然而,显然随着锐炫的出现,情况发生了变化。现在有了一块大的GPU,并且很多时候你的性能受限于CPU,所以驱动程序需要重新架构,以减少每帧所需的CPU工作量。所以显卡当受限于CPU时,显卡会从更快的CPU中获得更多好处。

ARC_05.jpg

这是一个简化过的游戏流程示意图,每一帧开始,CPU会执行物理计算、命中检测,将目标移动到新的位置,可能会绘制新的几何图形等,然后会进行CPU渲染,渲染完后会把所有这些东西都会通过一系列的DirectX调用传递,然后会执行一个称为“Present”的操作,然后CPU就开始等待GPU把画面渲染完并输出,在此期间CPU会闲置,等待“Present”返回,然后开始下一帧的渲染,从一帧的“Present”到下一个帧的“Present”之间的时间间隔就是Frametime帧生成时间。

大家都相当看重这个帧生成时间,因为这关系到游戏画面的流畅度,然后从渲染流程来看,GPU并不是一直在工作,英特尔就提到了GPU Busy这概念,也就是GPU相对于帧生成时间有多忙。

ARC_06.jpg

上图是酷睿i5-13400搭配锐炫A750使用3490驱动运行《守望先锋2》时的帧生成时间和GPU Busy的对比,可以看到有时GPU Busy明显低于帧生成时间,说明这一刻CPU所花费的时间要比GPU所花费的时间长得多,而在这里的中间部分,它们距离更近,说明这时可能两者负载均衡或者受限于GPU。

ARC_11.jpg

当CPU受限时游戏的渲染流程是这样的,可以看到等待时间相当长,而GPU渲染时间很短,而这个等待部分到底发生了些什么呢?

应用程序或者游戏会向DirectX发送渲染命令,然后将这些渲染命令转换为GPU驱动程序可以理解的内容,这时驱动程序需要做很多工作。它需要将常规的非特定于供应商的DirectX内容转换为英特尔了解的语言,以及英特尔GPU可以执行的操作,可以看作在DirectX和GPU了解的微操作之间进行翻译,有时候这可能会花费很长时间,这就是英特尔驱动程序刚开始时优化不够导致的。

ARC_07.jpg

上面是使用最新的驱动时帧生成时间和GPU Busy的对比,可以看到新驱动大幅降低了帧生成时间,两条曲线重合度相当高,也就是变成了GPU受限或者平台的状态,GPU利用率会更高,而玩家也能获得更高的游戏帧率。

ARC_08.jpg

英特尔不会止步于此,将致力于持续优化英特尔锐炫显卡。此次DX11的优化升级是英特尔在软件优化和游戏技术集成方面践行对玩家承诺的又一力证。自台式机显卡发布以来,英特尔累积发布了30次驱动更新,为57款新游戏提供发售首日(Game on)优化支持,并为众多游戏提供了很多其他方面的改进。由AI驱动的英特尔XeSS技术在游戏领域发展势头迅猛,现已获得超过70款游戏的支持。

ARC_09.jpg

英特尔还为发烧友带来了一款名为“PresentMon”的工具,这是一款英特尔在多年前开发的工具。PresentMon可以为许多用于图形性能分析的软件提供支持。今天,英特尔发布了英特尔PresentMon的第一个测试版本,通过对该工具的全面优化升级,为发烧友们带来更加易于使用的体验,此外还添加了新功能,方便玩家进行游戏性能分析。

ARC_10.jpg

首先自然就是游戏内屏显功能,可以在运行游戏时在屏幕上显示性能数据,帮助玩家实时监控GPU的电压和温度等,同时也可以查看99th帧时间与GPU占用率图表。此外它还能监控上面所说的GPU Busy指标,有了它用户通过它可以看到GPU实际使用了多少时间进行实际渲染而不是处于等待状态,或者在运行游戏的PC是否处于CPU和GPU平衡状态。

英特尔PresentMon可以在DirectX 9、11、12和Vulkan 上运行,也包含许多用于PresentMon的命令行工具。开发人员可以在自己的应用程序上独立使用PresentMon,英特尔也会持续对该工具提供支持。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK