5

FPGA实时光追演示:Artix平台效能是锐龙R9-4900H CPU软解的50倍

 1 year ago
source link: https://www.163.com/dy/article/HIGI79LV0511BLFD.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

FPGA实时光追演示:Artix平台效能是锐龙R9-4900H CPU软解的50倍

2022-09-30 08:48:09 来源: cnBeta.COM 浙江  举报

尽管在传统硬件仿真领域,“可编程逻辑门阵列”(FPGA)的名气要更高一些。但近期一些成功的 FPGA 光追游戏运算演示,再次吸引了许多人的目光,因为这通常是图形处理器(GPU)的优势领域。TechSpot 报道称,来自两位开发者的新工作流工具,使得一枚普通的 FPGA、能够实现较传统 x86 处理器更惊人的效率提升,为多个行业的节能运营开辟了新经验。

?url=http%3A%2F%2Fdingyue.ws.126.net%2F2022%2F0930%2Fb63d00c6j00rizxd4001cc000hs00dmg.jpg&thumbnail=660x2147483647&quality=80&type=jpg

Arty A7 FPGA 开发板资料图

本次演示选择了一个在棋盘上弹跳的闪亮球形物体,且它用到了实时光线追踪功能 —— 之前没人指望过一款中型 FPGA 芯片能够轻松应对此类应用。

不过更值得称道的,还是 FPGA 运行游戏所消耗的能量,远低于功能更强大的 AMD 笔记本电脑处理器。

?url=http%3A%2F%2Fdingyue.ws.126.net%2F2022%2F0930%2Ffc0b1661j00rizxd4000lc000jg00axg.jpg&thumbnail=660x2147483647&quality=80&type=jpg

在 Artix 7 100T 硬件上,Victor Suarez Rovere 和 Julian Kemmerer 借助他们的 CflexHDL / PipelineC 工具,用 C 语言构建了这一演示所需的 FPGA 固件代码。

作为比较,两位开发者搬来了 AMD 锐龙 R9-4900H 平台、并编译了基于 CPU 软解(不使用集成的核显)的相同演示。

两者均在 1080p 下以大约 60 FPS 的帧速率运行游戏,但需要截然不同的性能配置文件来完成任务。

Sphery vs. Shapes - Victor Suarez Rovere(via)

据悉,Artix 平台采用了 28nm 节点工艺的 FPGA 芯片,主频为 148 MHz、具有约 10 万个逻辑元件。

相比之下,锐龙 R9-4900H 是一款 8C / 16T 的 7nm 处理器。开发人员在 4.2 GHz 的加速频率附近,调用了该芯片的所有核心线程。

Rovere 和 Kemmerer 估计,Artix 的晶体管数量,大约只有这枚锐龙移动芯片的 1 / 15 。

?url=http%3A%2F%2Fdingyue.ws.126.net%2F2022%2F0930%2F9c574b34j00rizxd4001kc000wo00n7g.jpg&thumbnail=660x2147483647&quality=80&type=jpg

尽管硬件规模上存在相当大的差距,但 FPGA 演示仅消耗了 660 mW 的功率。而且就算没用到主动式散热解决方案,该芯片仍“几乎没有发热”。

另一方面,x86 架构的锐龙 R9-4900H 的功耗达到了 33 W —— 不仅 50 倍于 FPGA,风扇也在 88℃ 的高温下猛转以实现相同的性能。

Rovere 和 Kemmerer 据此推测,7nm FPGA 芯片可进一步将能效差距扩大至 6 倍、同时功耗低至锐龙 R9-4900H 的 1/300 。

?url=http%3A%2F%2Fdingyue.ws.126.net%2F2022%2F0930%2F53d0a3d9j00rizczq001fc000jg00img.jpg&thumbnail=660x2147483647&quality=80&type=jpg

当然,我们不该彻底无视 APU 上的核芯显卡、或在搭配专用独显(GPU 加速卡)下可实现的更高效能。

但这么做仍无法消除与 Artix 平台的差距,更别提采用更先进的 FPGA 解决方案来发起挑战了。

最后,感兴趣的朋友,可移步至 PipelineC-Graphics 的 GitHub 项目主页(白皮书),以获知更多细节。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK