4

一颗芯片统治一切,英伟达发布Thor雷神,淘汰Atlan

 1 year ago
source link: https://www.36kr.com/p/1924088771607303
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

一颗芯片统治一切,英伟达发布Thor雷神,淘汰Atlan

赛博汽车·2022-09-21 03:18
英伟达砸下“雷神之锤”。
v2_a82db3d6edca4cc3beddc5a4c8d88c29_img_000

Thor将于2025年投入生产,极氪是第一个尝鲜的车企。

自动驾驶在英伟达商业版图中的地位愈发重要。

北京时间9月20日晚间,GTC秋季大会主题演讲中,英伟达创始人黄仁勋在介绍每项技术、产品时,几乎都会带上自动驾驶,而到了专属自动驾驶的环节,更是把场面推向了高潮——

他宣布:“Atlan不再是第一了……它将被Thor(雷神)取代”。后者的吞吐量是Atlan的两倍,交付性能也是Atlan的两倍以上。

Atlan于2021年的GTC大会上发布,单颗算力达到1000TOPS。按照英伟达原本规划,Atlan将于2023年向开发者提供样品,并于2025年大规模量产上车。

如今来看,DRIVE Thor显然要取代Atlan,成为DRIVE Orin的后续产品,于2025年投入生产。目前Orin正在生产中,可提供254 TOPS算力。

这也意味着,Atlan还未上市就面临自我淘汰,英伟达不亏是芯片领域的“卷王”。

01 Thor战力值拉满,算力达2000 TOPS

早在2015年,英伟达即推出了NVIDIA Drive系列平台,赋能自动驾驶生态。并在CES 2015上推出了基于英伟达Maxwell GPU架构的第一代平台:搭载1颗Tegra X1的DRIVE CX,主要面向数字座舱;以及搭载2颗Tegra X1的DRIVE PX,主要面向自动驾驶。

此后几乎每年英伟达都要更新一至两次Drive平台,每隔两年发布一款车规级SoC芯片,且不断拉升算力水平。

2020年,Xavier芯片算力为30 TOPS,2022年量产上车的Orin算力一跃至254 TOPS。

Thor,则直接将战力值拉满:这颗SoC芯片内部拥有770亿个晶体管,以此可实现2000 TOPS的AI算力,或者是2000 TFLOPs

v2_130e47dfe4d64678a5197f8c741b382e_img_000

Δ 英伟达自动驾驶芯片参数不断提升

凭借强大的性能参数,Thor已经不仅局限于“小小的”自动驾驶芯片,而是明确表示:为汽车的中央计算架构而生

Grace(CPU)、Hopper(处理Transformer模型引擎)和Ada Lovelace(GPU)。”黄仁勋称,Thor性能指标的实现,主要依靠这三个因素。

在黄仁勋看来,Hopper架构的transformer深度神经网络引擎,以及vision transformer的快速变革都至关重要,必须纳入到下一代的机器人处理器,而Ada中多实例GPU的发明,将有助于车载计算资源的集中化,可将成本降低数百美元。

Grace则拥有非常出色的单线程性能。据悉,英伟达首款数据中心CPU Grace是以美国海军少将、计算机编程先驱Grace Hopper的名字命名。它是一款高度专用型处理器,主要面向大型数据密集型HPC和AI应用。

黄仁勋称,以往,所有的并行处理算法都由GPU卸载和加速,因此其余的工作负载往往受到单线程限制,而Grace可以弥补。“基于以上的基础,NVIDIA工程师竭力打造了Thor。”

据介绍,DRIVE Thor是第一个集成推理转换器引擎的AV平台,这是NVIDIA GPU中张量核心的新组件。借助该引擎,DRIVE Thor可以将Transformer深度神经网络的推理性能提高多达9倍,这对于支持与自动驾驶相关的大量复杂Al工作负载至关重要。

v2_dbccbe8e85b744b295f4abd906280ae6_img_000

Δ 英伟达Thor拥有强大性能

DRIVE Thor的另一个优势是其8位浮点(FP8))功能。通常,当从32位FP数据转换为8位整数格式时,开发人员会失去神经网络的准确性。DRIVE Thor具有2000 teraflops 的FP8精度,允许在不牺牲精度的情况下过渡到8位。

吉利旗下的汽车制造商ZEEKR宣布将在其集中式车载计算机上集成DRIVE Thor,用于下一代智能电动汽车,将于2025年初开始生产

目前,ZEEKR旗下车型极氪001采用的是Mobileye EyeQ5芯片,它也是全球首发 Mobileye EyeQ5的车型。

02 可被配置为多种模式,Thor想要统治一切

Thor的诞生,不仅是对算力、性能的提升,黄仁勋还希望颠覆现有智能汽车芯片架构。

当下,汽车的停车、主动安全、驾驶员监控、摄像头镜像、集群和信息娱乐均由不同的计算设备控制。黄仁勋称,在未来,上述功能将不再由单独的计算设备控制,而是由在Thor上运行的,并随时间推移不断改进的软件所提供

这意味着,Thor可被配置为多种模式,可以将其2000 TOPS和2000 TFLOPs全部用于自动驾驶工作流;也可以将其配置为将一部分用于驾驶舱AI和信息娱乐,一部分用于辅助驾驶

“Thor的多计算域隔离允许并发的、对时间敏感的多进程无中断运行,你可以再一台计算机上同时运行Linux、QNX和Android。”黄仁勋称,Thor集中了众多计算资源,不仅降低了成本和功耗,同时还实现了功能的飞跃。

v2_b8cdf796228a4163af41b0e4bd86de95_img_000

Δ 英伟达Thor可被配置为多种模式

用一颗大算力芯片解决所有问题,不止是英伟达独有念头。此前地平线创始人余凯也曾表示,征程5发布后,未来智能驾驶和智能交互会合在一个芯片上计算。

不过,有观点认为,这并不是一件容易的事。智能座舱和智能驾驶架构是两套完全不同的体系,诉求也完全不同。

对于智能座舱架构来说,其上层软件(底层软件是芯片厂商或第三方来负责),如安卓、黑莓,或者苹果、特斯拉诉求是开放、开源、迭代快,甚至底层代码都向开发者打开,这样才能够吸引更多的软件开发者。

而ADAS逻辑诉求正好相反,它需要足够闭合。ADAS的逻辑思路非常简单,主要是加速、减速、直行、拐弯等指令。需要足够闭合以保证谁都进不来,确保高度安全。

与此同时,智能座舱和智能驾驶对芯片算力本身需求也是不同的。前者只需要考虑CPU算力和散热,后者指标诉求要复杂的多,要看CPU、GPU和NPU。

发展方向不同、考核指标不同,导致尽管有一些车企考虑跨域融合,但目前大多数车企下两代产品依然选择两个架构、两个芯片

不过,如果Thor真的能做到“物美价廉”,一颗芯片统治一切并非不可能。

03 打造端到端平台,大幅提升仿真能力

构建机器人计算设备需要两类计算资源。”黄仁勋进一步介绍称,一类是位于数据中心的AI工厂,主要用于数据处理、训练AI模型、数字孪生模拟以及绘制世界地图;另一类是汽车内的AI计算设备,通过处理传感器数据以感知环境,躲避障碍物,以及驾驶汽车前往目的地。

NVIDIA DRIVE是一个面向自动驾驶汽车开发和部署的端到端的平台。在开发方面,DRIVE包括Replicator合成数据生成、NVIDIA AI基础设施、DRIVE Sim和DRIVE Map;在部署方面,DRIVE包括全栈驾驶和车内AI应用、AI计算机和Hyperion自动驾驶汽车参考架构。

随后,黄仁勋展示了NVIDIA DRIVE平台上的新功能:由NVIDIA研究部门推出的名为Neural Reconstruction Engine的AI工作流,现在已经成为DRIVE Sim的一项主要功能

v2_22dfe44f4b5949989891c0f407b4c079_img_000

Δ NVIDIA DRIVE平台

“创建模拟场景耗时费力,而且难以扩展。因此,英伟达的研究人员开发了一个AI工作流,可根据记录的传感器数据构建3D场景。”其介绍称,在将3D场景导入到DRIVE Sim后,可通过人工创建的内容或AI生成的内容对其进行增强。这个视频到3D几何图形的工作流,可以在NVIDIA OVX系统上运行,使英伟达能够在全球范围内创建模拟场景。

“从最开始到车队运营,DRIVE Sim在构建驾驶系统方面发挥了至关重要的作用,它是CI/CD持续集成/持续部署过程中不可或缺的一部分。”黄仁勋称,DRIVE Sim的其中一项重要功能是硬件在环,这意味着允许在AI工厂中运行整个车载软件栈

AI车载计算机并不知道它实际上是在模拟环境中,既不在车内,也不在道路上行驶。支持硬件在环的DRIVE Sim还可以模拟车内环境。

未来的汽车不仅会有简单的仪表板,还有将数字设计和物理设计相结合的环绕显示屏。汽车设计师、软件工程师和电子工程师可以在DRIVE Sim中开展协作。同时运行所有的实际计算机和软件栈。据称,DRIVE Sim将成为他们的虚拟设计工作室。

“我们正在扩展NVIDIA DRIVE Sim平台,凭借完整的硬件在环支持,创建汽车内部的数字孪生。NVIDIA Omniverse平台将这一切融合在一起。设计师和工程师可以并肩工作,在造就真正的汽车之前完美集成物理设计与数字接口。”

DRIVE Sim基于Omniverse构建,将加速新型AI驾驶舱和车载信息娱乐系统的开发,并通过在未来汽车的数字孪生中测试这些系统来提高可用性。

Δ 英伟达展示仿真成果

Omniverse是NVIDIA提出的虚拟世界仿真引擎。根据此前介绍,Omniverse的世界在物理上是精确的,遵循物理学定律,可以在宏大的尺度上运行,可复制,能将设计师与观众, AI与机器人联系到一起。

正如Tensorflow以及Pytorch是当前AI软件中不可或缺的计算框架,NVIDIA希望将Omniverse打造成为机器人时代的至关重要的一环,迎来AI的下一波浪潮。

此次活动中,英伟达也宣布推出Omniverse云服务,用于构建和操作工业元宇宙应用程序

04 汽车和机器人业务正成为英伟达新增长引擎

“安全是机器人开发的重中之重。”在自动驾驶环节最后,黄仁勋表示,构建机器人系统需要组建两个计算机系统,数据中心的AI工厂和车载AI计算机。从数据中心到汽车内部,英伟达的系统全面采用了安全架构、设计和方法。

截止目前,英伟达在安全系统和流程方面,研发已经投入1.5万人工年,对500万行代码进行安全评估。“我们致力于采用端到端安全方法,并将其从AI工厂扩展至车队。

重投入背后,是出于对未来市场的判断。

美东时间8月24日盘后,英伟达正式发布截至2022年7月31日的 2Q23 财报。与两周前英伟达公布的财务预警信息一致,营收、毛利、净利均大幅下滑。而汽车和机器人业务二季度收入为2.2亿美元,同比增长45%,成为少有亮色

彼时,黄仁勋再次重申,“汽车正在成为一个科技行业,并有望成为我们下一个价值10亿美元的业务。”

显然,汽车和机器人业务,与数据中心业务一样,正成为英伟达的新增长引擎。而随着英伟达在自动驾驶芯片领域的持续耕耘,其已经取得了阶段较量的胜利,截止目前,Orin已经被40多家汽车、卡车、无人驾驶出租车和穿梭巴士的制造公司选择使用

至于英伟达能否笑到最后,Thor登场后或许给出答案。

本文来自微信公众号“赛博汽车”(ID:Cyber-car),作者:章涟漪,36氪经授权发布。

该文观点仅代表作者本人,36氪平台仅提供信息存储空间服务。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK