4

英伟达发布ChatGPT专用GPU,性能提升10倍,还推出云服务,普通企业也能训练LLM

 1 year ago
source link: https://www.qbitai.com/2023/03/43045.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

英伟达发布ChatGPT专用GPU,性能提升10倍,还推出云服务,普通企业也能训练LLM

head.jpgPine 2023-03-22 14:40:32 来源:量子位

还推出新AI加速技术,光刻计算速度提升40倍

Pine 发自 凹非寺

量子位 | 公众号 QbitAI

“AI的iPhone时刻已至”,英伟达或成最大赢家。

在GTC2023大会上,黄仁勋接连放出大招:

不仅发布了ChatGPT专用GPU,比之前就能实时处理ChatGPT的HGX A100快了10倍

还公布了其在芯片领域的进展,推出了新的cuLitho软件库,使光刻计算速度整体提高了40倍

dada538cbf7c410f818c1e9836f4662d~tplv-tt-shrink:640:0.image?traceid=20230322143425CFBF5DA6049C5F164BA2&x-expires=2147483647&x-signature=7pK1%2B8RXSHiXUTeqERqck3jK0h0%3D

从老黄的言语中也能得知,当下各种爆红的AIGC产品:ChatGPT、Stable Diffusion、DALL-E等都能见到英伟达的身影。

而去年年末至今,ChatGPT爆火,也顺势拉动了英伟达的股价,年初至今就上涨83%。

目前,英伟达的市值为6471亿美元。

3d4a49b8aa6c4bc68e4b86b85446b34b~tplv-tt-shrink:640:0.image?traceid=20230322143425CFBF5DA6049C5F164BA2&x-expires=2147483647&x-signature=pIk3bFlT3Sk%2B9jglymUzO7sSElM%3D

会上及会后采访中,老黄的言语之中也是透露着对AI生成内容的褒奖:

AI是用人类语言编程的新型计算机,未来每个人都将是程序员。

话不多说,会上具体都有哪些亮点,一起盘点下~

发布ChatGPT专用GPU

会前,网友们对GTC的猜测都集中在ChatGPT上。

而英伟达,也是毫不吝啬,不止ChatGPT,AIGC方面直接一把推出了四种针对AI任务的推理平台:

  • L4 Tensor Core GPU
  • L40 GPU
  • H100 NVL GPU
  • Grace Hopper超级芯片
ee7561768333405fba089f5f8ddbe658~tplv-tt-shrink:640:0.image?traceid=20230322143425CFBF5DA6049C5F164BA2&x-expires=2147483647&x-signature=gz0bG2C06E47PpUCmn%2BF7xVvrsw%3D

其中,H100 NVL GPU是英伟达这次推出的ChatGPT的专用GPU,它是基于去年已经发布的H100的改进版本:配备双GPU NVLink,将两张拥有94GB HBM3显存的PCIe H100 GPU拼接在一起。

性能的话,老黄形象地做了个对比:

相较于目前唯一可以实时处理ChatGPT的HGX A100,一台搭载四对H100和双NVLINK的标准服务器能将速度提升10倍,并且还可以将大语言模型的处理成本降低一个数量级。

期间,老黄还展示了自己亲自把首款签名版DGX交付给OpenAI的画面。

72a0968694bb47319290a9e8ed61fe88~tplv-tt-shrink:640:0.image?traceid=20230322143425CFBF5DA6049C5F164BA2&x-expires=2147483647&x-signature=%2FFnAOmQCeeKATVTOrjBfJFRX%2FrM%3D

然后再来说下其他三个推理平台:

L4是专门针对AI生成视频设计的一款通用GPU,它提供的视频性能比CPU高出整整120倍,能效提高了99%。

L40则是用在图像生成上的GPU,它能对AI生成2D、3D图像进行优化,相较于英伟达的云推理GPU T4,性能提升了10倍。

Grace Hopper超级芯片用在推荐系统和大型语言模型AI数据库上,图推荐模型、向量数据库和图神经网络都可以选择这款芯片。

更具体一点,通过900GB/s高速芯片对芯片的接口,Grace Hopper超级芯片可连接Grace GPU和Hopper GPU,而Grace和Hopper正是处理大型语言数据集的理想选择。

到这里,你以为关于ChatGPT的相关产品就没了?

大NO特NO。

在ChatGPT这块儿,英伟达还致力于下沉市场,联合微软Azure、Google GCP和Oracle OCI三家云厂商合作推出了DGX Cloud。

普通企业也能训练LLM。

也就是说,想要训练像ChatGPT的大语言模型,可以直接在网络上租赁DGX云服务,这样一来客户就能将英伟达DGX AI超级计算机实时接入公司。

英伟达提供的DGX服务器,包含8个H100或A100图形处理器和640GB内存,A100层的价格为每月36999美元。

而直接购买一个实体DGX服务器,就要花费20万美元,并且微软当时为了训练新必应也是斥资数亿美元购买了数万块A100芯片。

用cuLitho加速芯片创新

ChatGPT等一众AIGC产品毫无疑问已经成为当前的AI圈的宠儿,不过在英伟达眼中ChatGPT只是一个起点。

GTC大会上,老黄放出了另一枚重磅级“核弹”,把加速计算引入到光刻领域——推出英伟达cuLitho计算光刻库

af2437feb8064893b9db8c3fa02f2e86~tplv-tt-shrink:640:0.image?traceid=20230322143425CFBF5DA6049C5F164BA2&x-expires=2147483647&x-signature=xEolugbmMWgpSP2lyMk1W7fM4t8%3D

cuLitho计算光刻库是啥?

一言以蔽之,cuLitho是一个可以加速光刻基础计算的算法库,能够很大程度上提升光刻计算的速度,并且节省能耗。

老黄表示,目前计算光刻每年都需要消耗数百亿CPU时间。而运行在GPU上cuLitho,可以将目前光刻技术的性能提升40倍,功耗降低至此前的1/9。

甚至在某种程度上cuLitho还可以为行业2nm工艺奠定基础。

目前,英伟达已经与台积电、ASML和Synopsys等芯片厂商达成合作,后续芯片生产中,也会引入cuLitho这项AI技术。

其中,台积电CEO魏哲家称赞,cuLitho为台积电在芯片制造领域部署反向光刻技术和深度学习等光刻解决方案开辟了新的可能性。

老黄也在会上预告,台积电将在今年6月份的2nm芯片生产中引入cuLitho

ASML首席执行官Peter Wennink也做出计划,让所有的计算光刻软件产品都支持GPU,同时也表示与英伟达在GPU和cuLitho上的合作会给计算光刻带来巨大的好处。

Synopsys公司这边,在cuLitho平台上运行了Synopsys OPC软件,性能直接得到了从几周到几天的提升。

一些其他亮点

除了上面提到的这些,GTC大会上,英伟达还公布了一些其他合作项目:

比如说生成式AI方面有Adobe、Getty Images和Shutterstock。

医学方面,英伟达宣布了新的合作伙伴和Medtronic合作,黄仁勋透露,目前正在一起为构建一个医疗方面的AI平台,涵盖手术引导和机器人辅助手术。

6a23812324a5459cbdd2e9478552d2cf~tplv-tt-shrink:640:0.image?traceid=20230322143425CFBF5DA6049C5F164BA2&x-expires=2147483647&x-signature=CGd%2BhwtOl80gQjov%2BZ%2BlrUomsAM%3D

如果还想了解更多关于GTC2023的内容,可以戳下面链接查看直播回放。

直播回放:
https://www.youtube.com/watch?v=DiGB5uAYKAg

参考链接
[1]https://www.theverge.com/23649329/nvidia-dgx-cloud-microsoft-google-oracle-chatgpt-web-browser
[2]https://nvidianews.nvidia.com/news/nvidia-asml-tsmc-and-synopsys-set-foundation-for-next-generation-chip-manufacturing

版权所有,未经授权不得以任何形式转载及使用,违者必究。

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK