1

英特尔发布数据中心级GPU Flex系列:高性能、低功耗突破计算壁垒

 1 year ago
source link: https://server.51cto.com/article/742665.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

英特尔发布数据中心级GPU Flex系列:高性能、低功耗突破计算壁垒

原创
作者: 张诚 2022-12-19 18:14:40
基于英特尔XeHPG架构打造,其中Flex 170采用了全高PCIe卡设计,内置了32个Xe内核和32个光追单元,功耗为150W;Flex 140采用了半高PCIe卡的设计,内置了16个Xe内核和16个光追单元,功耗则降至75W。

数字时代的今天,爆炸式增长的数据总量,以及层出不穷的各种创新应用,使得数据中心的计算资源面临着巨大的压力。为了满足AI、3D游戏等等创新应用对于算力的需求,GPU、DPU等各种计算产品相继推出,异构计算时代正式开启。

近期,英特尔正式推出了其数据中心级GPU Flex系列,共有两种规格:75W的Flex 140配备了12GB内存,150W的Flex 170配备了16GB内存,两款产品均已向客户出货。作为异构计算的重要组成部分,GPU强大的并行计算能力能够补齐CPU所无法覆盖到的计算类型。随着Flex系列GPU的正式发布,英特尔进一步补全了旗下的产品线,以更加全面的产品更好的服务客户,推动企业数据中心的创新变革。

c59ac2a7498dd7a76d774318a176c52124d2d9.jpg

英特尔正式发布数据中心级GPU Flex系列

英特尔此次发布的数据中心级GPU共有两个型号,分别是Flex 140和Flex 170。

两款产品均基于英特尔XeHPG架构打造,其中Flex 170采用了全高PCIe卡设计,内置了32个Xe内核和32个光追单元,功耗为150W;Flex 140采用了半高PCIe卡的设计,内置了16个Xe内核和16个光追单元,功耗则降至75W。

为了提高产品的算力,Flex系列GPU内置英特尔Xe矩阵扩展(XMX)计算单元。据官方数据显示,Flex系列能够提供高达256Tops(INT8)的算力支持,AI能力得到了大幅提升。此外,在媒体运算方面,Flex系列GPU能够支持最多单卡4个(Flex140)媒体运算引擎,支持业界领先的AV1编码格式,在同样的视频质量下,能够为用户节省30%以上的传输带宽(vs.AVC)。

65f77a056ec8b65420192682d472b9166805e6.jpg

考虑到数据中心用户的实际需求,Flex系列GPU还提供了硬件SR-IOVr 技术支持,不需要软件授权费用即能够支持虚拟化,可以帮助企业客户节省大量成本支出。

为了便于用户基于Flex系列GPU开发应用,英特尔积极打造了开放、全面的软件堆栈,为开发者带来良好的开发环境与技术支持。

据英特尔市场营销集团副总裁、中国区数据中心销售总经理兼中国区运营商销售总经理庄秉翰介绍,Flex系列GPU基于英特尔开源软件工具oneAPI,提供统一的编程架构,包括一整套开发者熟悉的编程语言和标准的跨架构库、工具和框架,使开发人员可以利用oneAPI支持的开放软件堆栈,轻松地开展面向Flex系列GPU的设计工作,充分释放硬件的性能潜力。

除此之外,英特尔还提供了帮助用户开发开放的、易于移植的代码,更大限度利用多种跨英特尔硬件平台的组合,例如CPU和GPU。实现用不同的架构处理不同类型的数据,真正做到用好的工具解决好的问题。

高性能、低功耗突破计算壁垒

在本场发布会上,除了介绍新品的技术参数之外,英特尔还展示了一组Flex系列GPU在各种场景下的应用数据,以此来让记者更加充分的了解产品的性能。

在AI计算方面,由于Flex系列GPU支持XeSS超级采样技术。因此,通过AI超分的技术手段,在画面质量接近的前提下,大幅缩短渲染时间,进而提升运行效率。通过现场展示数据可以看到,在4K渲染下,XeSS超采样技术可以大幅缩短渲染时间,对于很多标清转高清和修复老视频的应用可以带来大幅度的性能提升。

e4ab2c057bdafaa06082296d881e2bbfafade4.jpg

此外,在AI推理能力方面,Flex系列GPU也展示出了强大的性能表现。发布会现场以智能视觉推理场景为例,先对视频流进行解码处理,然后再进行AI运算,得益于Flex GPU的媒体计算引擎和Xe矩阵引擎(XMX),Flex 170在多种不同的编码格式和AI模型的组合中的性能测试表现都超过了竞品。

a2e433f6071af620cd87657e7745b784840858.jpg

在媒体计算方面,由于Flex GPU系列支持的AV1编解码技术,相比于H.264技术在同样画质下可带来码率的大幅下降,从而降低数据的传输带宽,节省总体拥有成本。据数据显示,低功率的Flex 140 GPU在解码性能测试中取得了远超竞争对手GPU的成绩。

25b86ad55aa019625b8446b364d9902803c19b.jpg

在云游戏方面,通过当下热门的游戏如王者荣耀对两款产品进行了测试。数据显示,单张Flex 170显卡在游戏画质为720p@30fps时,能够同时支持多达68路的游戏同时运行。除了Android游戏之外,在最近的版本发布上,Flex GPU系列也支持Windows云游戏,同一张卡既可以支持Android云游戏,又可以支持Windows云游戏,对于合作伙伴来说,这是一个非常灵活的方案。

19df2a316492dc73752053acc8afd3ff9dd85a.jpg

最后,在转码性能上,现场展示的数据同样显示,英特尔Flex 140 GPU取得了远超竞品的性能测试成绩。

写在最后:随着数字化转型进程的加速,企业对于数据中心的算力要求越来越高,GPU作为重要的计算单元,已经得到了广泛用户的认可。此次英特尔重返数据中心GPU市场,也足以见证其重要性不言而喻。虽然,我们看到Flex GPU系列在发布会上展示的诸多优势,但由于市场长期被竞争对手占据,英特尔要想收复失地,的确并不容易。不过,英特尔也正在凭借着自己的优势,联合合作伙伴,共同发力。但至少,Flex GPU系列发布,给用户带来了低功耗,高性能的解决方案,为用户提供了更多的选择空间。

责任编辑:张诚 来源: 51CTO

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK