8

英特尔Arctic Sound-M数据中心GPU,一卡满足多场景图形算力需求-品玩

 2 years ago
source link: https://www.pingwest.com/w/263502
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

英特尔Arctic Sound-M数据中心GPU,一卡满足多场景图形算力需求-品玩

英特尔Arctic Sound-M数据中心GPU,一卡满足多场景图形算力需求

1小时前

英特尔®至强®可扩展处理器是面向云游戏、多媒体处理与传输、虚拟桌面基础架构和推理运算的处理器标杆,致力于为当今的媒介消费提供鼎力支持。随着当前工作负载密度和复杂程度的快速增长,以上每个细分领域都将提出不同的工作负载需求,包括从处理像素、推理和分析、到渲染新的画面内容,再到将这些像素输出至客户端设备进行查看或进一步分析。然而,目前这些工作都是通过在云端的各个独立产品来完成的。

在本届英特尔 On 产业创新峰会(Intel Vision)上,英特尔分享了其代号为 Arctic Sound-M(ATS-M)的数据中心 GPU 的更多细节。ATS-M 是一颗支持高质量转码和高性能的强大 GPU,能够提供每秒 150 万亿次运算(150 TOPS),共拥有两种配置。ATS-M 能够通过单一解决方案灵活地处理广泛的工作负载,并在不牺牲性能或者质量的同时,优化总体拥有成本(TCO)。

article-body

更多信息:欲了解关于代号为 Arctic Sound-M 的英特尔数据中心 GPU 的更多信息,以及 Business Insights Vision 上的演讲和新闻,请访问英特尔新闻中心。

面向数据中心工作负载的多用途 GPU

该英特尔数据中心 GPU 将包含两种不同的配置。150W 功率版本在一个3/4长、全高尺寸的 PCIe 4.0 加速卡中封装了 32 个 Xe 内核。75W 功率版本则在半高尺寸的 PCIe 4.0 加速卡中封装了两颗具有 8 个 Xe 内核的 GPU,共 16 个 Xe 内核。这两种配置均配备了 4 个 Xe 媒体引擎、英特尔首款面向数据中心的 AV1 硬件编码器和加速器、GDDR6 内存、光线追踪单元和内置 XMX AI 加速。

article-body

采用开源软件的行业领先数据中心 GPU

该英特尔数据中心 GPU 由完整的解决方案堆栈支持,为开发者提供了面向流媒体、云游戏和云端推理的开源软件堆栈,并广泛支持 AVC、HEVC、VP9,以及更多 API、框架和最新的编解码器。

oneAPI 为加速计算提供了高效、智能的路径,让开发者免受专有编程模型所带来的经济和技术负担。它为专用硬件的封闭编程语言供了开放的选择,即通过一套完整、可靠的工具包来完善现有编程语言和并行计算模型,从而释放硬件的全部性能,并且能够让开发者设计出开放、可移植的代码,更大限度地利用多种 CPU 和 GPU 的组合。

云游戏

全球云游戏市场呈现持续快速增长趋势,预计到2026年,其复合年增长率(CAGR)将达到 43.2%,市值将近 32 亿美元[1]。英特尔可为 Windows 和 Android 云游戏平台提供支持,为广大玩家带来高品质的游戏体验。ATS-M 拥有两种不同的产品外形设计,用户可灵活地选择符合他们特定工作负载的产品配置。无论用户对峰值性能、高密度提出需求,还是期待通过一个平台满足跨智能手机和 PC 游戏的融合云游戏解决方案,这款 GPU 均可以提供出色的游戏串流体验。

全堆栈媒体流支持

该 GPU 配备了英特尔首款基于硬件加速的 AV1 编码器,可在不牺牲质量的同时,带来 30%[2] 比特率的提升。[3]作为引领新一代媒体串流的 GPU,它可实现一卡同时处理多达 8 路 4K 视频流或超过30 路 1080p 视频流。在一台 4 卡服务器中,可以实现每节点处理 120 路视频流以及每机架处理 13,000 路视频流。

利用 Intel® oneVPL,媒体串流和传输软件堆栈可以面向包括 AV1 在内的所有主流编解码器进行解码和编码加速。流媒体发行商可以在 FFmpeg 或 GStreamer 这两大领先多媒体处理框架中进行选择,它们均可通过 oneVPL 针对英特尔 CPU 和 GPU 进行加速。英特尔还提供了开放视觉云(Open Visual Cloud),这是一套用于媒体、分析、图形和沉浸式媒体的开源软件堆栈,它针对云原生部署进行了优化,使其能够在 FFmpeg 和 GStreamer 框架内运行。

全堆栈虚拟桌面基础架构支持(VDI)

过去两年,随着远程办公需求的增加,虚拟桌面基础架构(VDI)和设备即服务(DaaS)迎来了快速增长(最近一项研究表明增长超过 11%[4])。现代操作系统和应用程序对图形处理的要求越来越高,显示器的分辨率也随之提高;GPU 可以通过承载渲染和编码功能,以更短的响应时间和更高的帧率来改善用户体验。由此释放出来的 CPU 处理能力可以带来应用程序工作负载的性能提升。

英特尔的这款数据中心 GPU 还提供了灵活的虚拟 GPU(vGPU)调度策略(固定的、灵活的以及硬件利用率优化过的时间片任务调度器),让管理员能够单独微调 GPU 上每个虚拟机的运行指令。目前,其他厂商的产品仅允许在所有虚拟机的全局设置中进行相关调整。

与目前市面上其他产品不同的是,英特尔不会针对基于硬件的可扩展 I/O 虚拟化(SIOV)额外收取任何软件授权费,这将有助于相关提供商降低虚拟化部署的总成本。

全堆栈媒体分析支持

每个在视觉媒体场景执行的推理都需先经过视频解码和预处理,然后才能交给 AI 模型进行下一步操作。集成两颗 GPU 的 75W 功率版本 ATS-M 能够在计算和解码能力上实现很好的平衡,且不受媒体限制。因此,它能够针对媒体分析类的工作负载提供良好的扩展性,为客户提供更高的流密度和更低的成本。

在使用 oneVPL 对于视频流的解码和编码进行加速的同时,oneDNN(oneAPI 深度神经网络库)可针对内核进行 AI 优化,加速面向 TensorFlow 或 PyTorch 框架的推理模型;也可通过 OpenVINO 的模型优化器和推理引擎,进一步加速推理以及客户工作负载的部署。上述 AI 和媒体软件以及堆栈的组合可以在至强处理器和英特尔数据中心 GPU 之间无缝运行。

代号为 Arctic Sound-M 的英特尔数据中心 GPU 已经获得超过 15 款来自业界领先合作伙伴的设计,并将于 2022 年第三季度发布。


Recommend

  • 30
    • www.v2ex.com 3 years ago
    • Cache

    3080 一卡难求.......

    NVIDIA - @VintageZ - 事情是这样的。今年八月份新配了一台主机,准备好好享受一番,配置 3700x+2080s 。哪知道九月底老黄发布新显卡,同样价格( 2080s 购买的时候 5399 )能买到性能翻一倍的显卡

  • 9

    “记得我刚抢的时候,还穿着背心短裤,现在都供暖好久了。”这两个月,上电商平台抢购6800XT或者RTX3080的显卡,成为游戏玩家扬扬的日常,可惜最终都一无所获。很多时候他都是眼睁睁地看着抢购倒计时结束到直接变灰的抢购按钮,连拼手速的机...

  • 7

    当游戏玩家们的趁手兵器——显卡,突然用来改变金融世界,游戏娱乐需求遭到挣钱原始冲动的正面硬刚,而这场争夺战,甚至已升级到了抢高端笔记本电脑的新地步!矿工盯上游戏笔记本加密货币的大涨,带动了矿机产业链的持续火热,R...

  • 10

    2020 年 9 月 2 日凌晨,英伟达创始人兼 CEO 黄仁勋从背后的厨房拿出了 RTX 3080,并正式宣布推出基于安培架构的「GeForce RTX 30 系列」显卡。   在公布完价格后,无数显卡爱好者欢呼鼓舞,RTX 3070 官方售...

  • 7

    Intel展示Arctic Sound M数据中心GPU,150W的单芯和75W的双芯两个版本

  • 11

    你怕写作,怕写不出,怕写不顺、怕写不好。 我以前也怕,一天都写不出几个字,坐在电脑前几个小时就是没有想法,即使写出来自己也不满意,也不敢公开害怕点评。 就像福楼拜说的那样:「有时,当我脑袋空空洞洞,文思枯竭之际,当我发现自己画了整页...

  • 5

    《日课一卡工具箱》发布,免费领取 Posted on 2022-11-12 ...

  • 7

    「日课一卡训练营」是一个纯粹的的技术与工具合集,它只做一件事:帮助你每天写一张卡片。 我希望你从这个训练营拿到的东西都是可以开之即用,用之有效的东西 目前日课一卡工具箱已经开放免费领取,使用工具箱中的基本工具,你可以最低成本开始践行...

  • 6
    • www.cnfeat.com 1 year ago
    • Cache

    如何日课一卡写小故事?

    如何日课一卡写小故事? Posted on 2022-11-20 ...

  • 2

    一日一卡挑战:RTX2080Ti搞定大模型训练,算力节省136倍,学界欢呼 作者:机器之心 2022-12-30 13:42:22 在该工作中,人们讨论了基于 transformer 的语言模型在计算量非常有限的环境中可以实现多少性能,值得庆幸...

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK