4

黄仁勋:「核弹工厂」即将上线,要让所有人用上生成式 AI

 1 year ago
source link: https://www.geekpark.net/news/322910
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client
今日看点
9min read

黄仁勋:「核弹工厂」即将上线,要让所有人用上生成式 AI

2023/08/09
87f28eb5a365bac628dbd2d89af7b0c5.png

还是那句话,买的越多,赚的越多。

「20 年前我们推出了 RTX 显卡,5 年前我们将图形计算与 AI 结合,推出了「星战」Demo。」

美国当地时间 8 月 8 日早上,英伟达创始人、CEO 黄仁勋在世界计算机图形会议 SIGGRAPH2023 上,开场回顾了英伟达在图形计算上的高光时刻,并且展示了最新的实时渲染的 4K 分辨率的 3D 赛车追逐 Demo。

不过,仅仅几分钟后,「皮衣教主」的演讲,就从 3D 图形完全过渡到 AI 上了。作为人工智能浪潮中最重要的人物,黄仁勋为「普及生成式 AI」提供了更生猛的硬件,和更智能的应用和平台。

当天,黄仁勋曝光了用于生成式 AI 的 GH200 Grace Hopper 超级芯片、NVIDIA AI Workbench 以及通过生成式 AI 和 OpenUSD 升级的 NVIDIA Omniverse

同时,黄仁勋还宣布英伟达与 AI 开源社区 Hugging Face 合作,将把生成式 AI 超级计算能力交付给数百万开发者,为他们构建大型语言模型(LLM)和 AI 应用提供支持。

「还是那句话,买的越多,省的越多。」即使到了现在,黄仁勋依然不改金牌销售的风格。

「核弹工厂」,即将上线

「生成式 AI 时代的来临,就像 iPhone 时刻一样。」黄仁勋感概,英伟达加速计算的旅程与深度学习研究人员的旅程相遇,现代人工智能的大爆炸发生了。

五年前,英伟达通过在 GPU 上引入 AI 和实时光线追踪,重新定义了图形技术。但是「当我们通过 AI 重新定义计算机图形时,我们也正在为 AI 重新定义 GPU」。

结果就是,出现了越来越强大的系统,例如 NVIDIA HGX H100,利用八个 GPU,总计 1 万亿个晶体管,比基于 CPU 的系统提供了显著的加速。

0c53ec94c937c0dd858fb7120abafe98.png

黄仁勋展示 GH200  芯片|英伟达

五年后,为了继续推动 AI 发展,英伟达推出了 Grace Hopper 超级芯片,即 NVIDIA GH200,它将 72 核 Grace CPU 与 Hopper GPU 相结合,提供 1 EFLOPS 的 AI 算力和 144TB 的高速存储,并于今年 5 月全面投产。

对于 GH200,黄仁勋在演讲又拿出了看家金句,「如果我可以请你记住我今天演讲中的一件事,那就是,未来属于加速计算,你买的越多,你省的越多」。

NVIDIA GH200 最可怕的不是性能强悍,而是近乎疯狂的「可扩展性」

GH200 Grace Hopper 超级芯片平台。该平台连接多个 GPU,用于处理复杂的生成式工作负载,包括大型语言模型、推荐系统和矢量数据库。据称,与前一代相比,双配置的内存容量是之前的 3.5 倍,带宽是之前的 3 倍,服务器配备 144 个 Arm Neoverse 核心、8 petaflops 的 AI 性能和 282GB 的最新 HBM3e 内存技术。预计 2024 年第二季度将有客户基于该平台推出自己的系统。

ee2f2faf2fc01283fe755651e8ccacaa.png

GH200 组成的 AI 超算实体大小图|英伟达

根据老黄的说法,在相同的成本(1 亿美元)下,2500 块 GH200 组成的计算中心,在 AI 计算的能效上,要比传统的 CPU 计算中心高 20 倍。

如果说上千块 GH200 适用的对象是「前沿大语言模型」,对于已经成为「主流」的模型,英伟达也提供了能被普通人和公司使用的、成本更低的产品。

基于专业图形应用需求,如计算机辅助设计和数字内容创作,英伟达还发布了基于 Ada Lovelace 架构的 RTX 4000 20GB、RTX 4500 24GB 和 RTX 5000 32GB,分别能提供 26.7、39.6、65.3 FP32 TFLOPS 的计算性能。

bb9f8b86112b137411af4b8fda936627.png

英伟达推出搭载 L40S GPU 的 OVX 服务器产品|英伟达

此外,英伟达还推出了搭载 L40S GPU 的 OVX 服务器产品,每台服务器最多可以装八个 L40S GPU,每个 GPU 有 48GB 内存。对于具有数十亿参数和多种数据模态的复杂 AI 工作负载,相较于 A100 Tensor Core GPU,L40S 能够实现 1.2 倍的生成式 AI 推理性能和 1.7 倍的训练性能。

「专为生成式 AI 时代打造的 AI 超算」,GH200 的 PPT 页面上如此写道。

联手开源,「普惠生成 AI」

为了加速各类企业定制生成式 AI,黄仁勋宣布,英伟达推出「AI Workbench」。

据称,它为开发人员提供了一个统一、易于使用的工具包,可以在个人电脑或工作站上快速创建、测试和微调生成式 AI 模型,然后将其扩展到几乎任何数据中心、公有云或 NVIDIA DGX Cloud。

AI Workbench 主要降低企业启动 AI 项目的门槛。通过在本地系统上运行的简化访问界面,它允许开发人员从流行库(如 Hugging Face、GitHub 和 NGC)中微调模型,使用自定义数据。然后,这些模型可以在多个平台之间共享。

19aea124d580dbd9dc3eb375f40ccc67.png

黄仁勋介绍英伟达 AI Workbench|英伟达

全球各地企业都在竞相寻找合适的基础架构并构建生成式 AI 模型和应用,尽管现在已经有数以千计的预训练模型可用,但是使用许多开源工具进行定制可能仍具挑战性且耗时。

「为了使这种能力普惠,我们必须使其能够在几乎所有地方运行。」黄仁勋称,「让所有人都能参与生成式 AI。」

借助 AI Workbench,开发人员可以只需点击几下就可以定制和运行生成式 AI。它允许他们将所有必要的企业级模型、框架、软件开发工具包和库汇集到一个统一的开发者工作区中

据称,包括戴尔、惠普、Lambda、联想和 Supermicro,都正采用 AI Workbench,因为它可以将企业生成式 AI 能力带到开发人员希望工作的任何地方,包括本地设备。

在演讲中,黄仁勋展示了 AI Workbench 和 ChatUSD 如何将所有这些功能结合在一起:允许用户从 GeForce RTX 4090 笔记本电脑启动项目,并随着项目变得更加复杂而无缝扩展到工作站或数据中心。

据黄仁勋展示,用户可以提示模型生成一张玩具黄仁勋在太空中的图片,但初始模型提供的结果不适用,因为它从未见过玩具黄仁勋,这时候用户可以用八张玩具黄仁勋的图片微调模型,然后再次输入提示,获得正确的结果。

4367cb0c40aa2d018769687c5c38eb76.png

使用提示词创建出的黄仁勋人偶上太空|英伟达

然后,使用 AI Workbench,新模型就可以部署到企业应用程序中。

黄仁勋还宣布了英伟达与 Hugging Face 的合作伙伴关系,后者拥有 200 万用户,或将使英伟达的生成式 AI 计算能力成为数百万开发人员构建大型语言模型和 AI 应用的工具。

作为合作的一部分,Hugging Face 将提供一个新的服务——「训练集群即服务」(Training Cluster as a Service),由 NVIDIA DGX Cloud 提供支持,该服务将在未来几个月内推出

开发人员将能够在 Hugging Face 平台内访问 NVIDIA DGX Cloud AI 超级计算,以训练和微调先进的 AI 模型。据悉,Hugging Face 社区已分享超过 25 万个模型和 5 万个数据集。

这将是一个全新的服务,将世界上最大的 AI 社区与世界上最好的训练和基础设施连接起来。」黄仁勋称。

ChatUSD,对话式「3D 生成」

就在本周,英伟达、苹果、Adobe 和 Autodesk 等公司联手成立 OpenUSD 联盟,将这个诞生于皮克斯的 3D 标准,推向更广阔的世界。

而将 OpenUSD、AI 以及 Omniverse 结合,设计和开发人员将能通过 ChatUSD 这样的对话式界面,直接用自然语言修改和创建 3D 环境及物体,极大简化 3D 制作流程。

a1554070466ac8d355ebbd87287a8ed1.png

黄仁勋介绍 OpenUSD 联盟|英伟达

该联盟将标准化并扩展 OpenUSD,这是开源的通用场景描述框架,是实现互操作性的 3D 应用程序和项目的基础,涵盖从视觉效果到工业数字孪生的各个领域,如连接电影和动画流程,创建真实精确的实时数字工厂、仓库、城市甚至地球数字副本等。

英伟达和 Adobe 还计划将 Adobe Firefly(Adobe 的创意生成式 AI 模型系列)作为 API 提供在 Omniverse 中。

据悉,Cesium、Convai、Move AI、SideFX Houdini 和 Wonder Dynamics 等 AI 工具现在已经通过 OpenUSD 连接到 Omniverse。

abb19aa7addc90b1397b30af706101e7.png

使用 OpenUSD,各个管线的工具可以同时使用一个素材和场景|英伟达

例如,Wonder Dynamics 通过新的 OpenUSD 导出支持,可以自动将计算机生成的角色动画、灯光和合成到现实场景中。Move AI 可以使用 Move One 应用程序进行单摄像机运动捕捉,可以生成 3D 角色动画,然后可以导出到 OpenUSD 并在 Omniverse 中使用。

现在,Omniverse 用户可以构建与其他基于 OpenUSD 的空间计算平台(如 ARKit 和 RealityKit)兼容的内容、体验和应用程序。

另外,黄仁勋还宣布了由英伟达构建的四个新的 Omniverse Cloud API,包括 ChatUSD、RunUSD、DeepSearch 和 USD-GDN Publisher,供开发人员更无缝地实现和部署 OpenUSD 管道和应用程序

df2eeb21e5e3781dbdbdd991aaad034a.png

使用 ChatUSD,可以用自然语言修改右边的 3D 模型|英伟达

其中,ChatUSD 可以回答 USD 知识问题或生成 Python-USD 代码脚本;RunUSD 可以将 USD 文件转化为渲染图像;DeepSearch 可以实现语义 3D 搜索;USD-GDN Publisher 可用于发布基于 OpenUSD 的高保真体验,实时流式传输到 Web 浏览器和移动设备。

英伟达 Omniverse 和模拟技术副总裁称,「工业企业正在竞相将其工作流数字化,这增加了对启用 OpenUSD 的、连接的、可互操作的 3D 软件生态系统的需求。」「最新的 Omniverse 升级让开发人员通过 OpenUSD 利用生成式人工智能来增强他们的工具,同时允许企业构建更大、更复杂的全球规模模拟,作为其工业应用的数字测试场。」

目前都有谁在用 Omniverse?据黄仁勋介绍,科技公司正在用它测试和模拟协作机器人,亚马逊用它模拟车队将仓库数字化,汽车厂商如梅赛德斯用它来模拟自动驾驶汽车,宝马用它模拟新的电动汽车生产线,将全球工厂网络数字化,Deutsche Mind 用它创建铁路网络的数字孪生,甚至还有公司用它创建地球的数字孪生,即地球的气候系统等等。

97b8a0c3b4b32a5e2d88bdec2530b9bf.png

据悉,英伟达还正在开发一种新的 SimReady 3D 模型结构。这些模型将包括真实的材料和物理属性,这对于准确训练自主机器人和车辆至关重要。例如,一个负责分拣包裹的自主机器人需要在 3D 模拟中进行训练,这些包裹在物理接触时移动和反应,就像在现实世界中一样。

在 AI 的推动下,协作式 3D 和工业数字化的时代正在到来。黄仁勋还认为,未来的工厂将是机器人工厂,「机器人协调一大堆机器人来制造本身就是机器人的汽车」「我们希望 AI 能够进行自我编程」。

「未来,整个工厂将由软件定义。」黄仁勋称。

作为这一波「生成式 AI」浪潮中最重要的「基建」公司,英伟达股票已经在最近暴涨 200%,一度突破万亿美元大关。

而在售卖「核弹」硬件之外,在软件、云计算和平台以及生态方面,英伟达同样不遗余力,因为只有让生成式 AI 真正进入到工业生产和办公中,才算是真正实现「AI 普惠」。而从这个角度来看,英伟达和现在的 AI 初创公司,以及正在向生成式 AI 转型的传统公司,其实在一条船上。

「买更多,省更多」,而只有「更多 AI」,英伟达才能保证自己「越赚越多」。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK