3

生成式AI加速数据中心变革升级!2024年数据中心热点技术展望

 6 months ago
source link: https://server.51cto.com/article/777854.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

生成式AI加速数据中心变革升级!2024年数据中心热点技术展望

原创
作者: 张诚 2023-12-28 10:14:42
2024年数据中心将会有哪些重点技术趋势?本文,对2024年数据中心发展趋势和热点技术的展望。

在数字经济的推动下,越来越多的企业开启了数字化转型之旅,数据中心行业发展良好,市场规模不断扩大。数据中心作为数字经济的主要载体和算力底座,2024年将继续保持增长态势。根据市场研究公司Dell'Oro Group的最新报告,全球数据中心资本支出预计将在2024年反弹至11%的增长率,因为部分超大规模云服务提供商将重返扩张周期,并且企业市场的支出冻结也将迎来缓和。

68182a24417e36ceb9c472561f0c40d71708b2.jpg

那么,2024年数据中心将会有哪些重点技术趋势?以下,是对2024年数据中心发展趋势和热点技术的展望。

生成式AI对数据中心算力提出更高要求

2024年,生成式AI仍旧是各大企业关注的热点,并将产生更多的生成式AI项目。随着生成式AI项目的不断落地,数据中心将面临更大的算力挑战。为此,数据中心将迎来重大变革。记者认为,在提升算力层面上,数据中心在2024年将会围绕以下热点进行重点突破。

1)异构计算

众所周知,生成式AI对数据中心算力提出了更高的要求,传统的以CPU为核心的计算方式显然已经无法满足人工智能对于算力的需求,CPU+GPU/FPGA/ASIC等异构式架构成为2024年以及未来数据中心的主要算力构成方式。

当然,在构建异构计算时,不仅仅要重点关注底层芯片,而且还要注意应用的开发方式,要软硬件并行,两条腿走路。同时,由于异构计算是将CPU、DSP、GPU、ASIC、FPGA等不同制程架构、不同指令集、不同功能的计算单元,组合起来形成一个混合的计算系统。在这一生态体系中,有着不同的厂商参与,彼此之间既是竞争关系,又是合作关系,只有通过多方的合作,才能不断优化算力架构,提高计算效率。

2)HBM高带宽内存

众所周知,生成式AI不但对CPU、GPU性能提出了更高的需求,也对存储性能的要求越来越高。传统的内存显然已经无法满足AI对于存储性能的要求,HBM(高带宽内存)成为2024年以及未来数据中心的技术趋势之一。

HBM通过利用3D芯片堆叠技术将多个DRAM芯片堆叠在一起,从而提供更大的存储容量。随着AI技术的发展,GPU的功能越来越强,需要更加快速地从内存中访问数据,以此来缩短应用处理的时间。特别是在生成式AI出现之后,大型语言模型 (LLM)需要重复访问数十亿甚至数万亿个参数,如此庞大且频繁的数据处理,往往需要数小时甚至数天的时间,这显然无法满足要求。于是,传输速度也成了HBM的核心参数。

目前,HBM大都采用了标准化设计:HBM 存储器堆栈通过微凸块连接到 HBM 堆栈中的硅通孔(TSV 或连接孔),并与放置在基础封装层上的中间件相连,中间件上还安装有处理器,提供 HBM 到处理器的连接。与此同时,HBM通过控制芯片对多个DRAM芯片进行控制,使它们能够同时读取或写入数据,从而提高了存储带宽和数据处理能力。

3)800G网络技术

网络性能是决定AI集群算力效率的核心要素。由于AI芯片对互联带宽的需要非常大,如H100互联达到了900GB(1B=8bps),加速了网络架构的变革,800G网络成为2024年数据中心的热点。

近年来,400G的快速部署表明业界能够快速提供最新的解决方案,并且随着服务提供商扩展和升级其数据中心,服务提供商已经准备好在2024年快速转向800G。为此,各大厂商也纷纷发布800G的网络产品和解决方案。

800G交换机端口、光模块和DAC的推出,为服务提供商提供了一个无需等待800GE标准即可升级网络性能的重要机会。IEEE 802.3df 800G和1.6T任务组的工作以及行业技术的发展将确保未来升级的稳健路线图。具有800G端口的25.6T交换机的推出为数据中心运营商利用网络创造了新的机会,能够显著提高性能,同时降低复杂性、成本和功耗。

节能环保推动液冷数据中心建设

数据中心的能耗问题一直备受关注,在“双碳”目标面前,如何降低数据中心能耗,也将成为数据中心运营者关注的重点。IDC指出,在国家“双碳战略”和东数西算的不断要求下,数据中心需要向绿色低碳迈进。与此同时,以人工智能、5G为代表技术热潮的兴起,也给数据中心带来资源使用和性能提升等挑战。

在政策的推动下,液冷数据中心将会是2024年以及未来很长一段时间内用户关注的重点技术。作为突破散热瓶颈,有效降低数据中心PUE关键技术,液冷技术在2023年进展迅速。众所周知,数据中心液冷散热主要有冷板式液冷和浸没式液冷两大技术。相比较浸没式液冷技术,冷板式液冷由于相对简单,因此更加容易部署。

当然,在液冷数据中心的建设上,目前仍旧存在很多问题,比较缺乏业界统一的标准、建设成本过高等。不过,随着技术的不断成熟,标准的不断完善,液冷数据中心将会越来越受用户青睐。

多云战略催生更多数据中心安全问题

数据中心的安全问题是一个老生常谈的话题。不过,随着2024年数据量的爆炸式增长,企业业务形态的变化,以及越来越多的企业部署多云战略,数据保护的难度正在不断加大,数据中心的安全问题将会越来越受重视。

面对各种网络攻击,数据中心运营者不但要建立健全数据中心的物理安全、网络安全等多道屏障,以更高规格的解决方案确保数据、业务安全。并且还要强化数据的备份保护,确保在受到攻击之后能够快速恢复数据,确保业务的正常运行。

与此同时,企业还要强化员工教育,防止人为错误导致的数据中心中断事故和攻击事件发生。

边缘计算推动小型数据中心建设

边缘计算的快速发展加速了边缘计算中心的建设步伐。据Gartner预测,到2025年将有75%的数据产生在数据中心和云之外并在边缘侧进行处理。据STL Partners的预测,到2030年,全球边缘计算潜在市场规模将增长到4450亿美元,10年复合增长率高达48%。

边缘计算市场成长空间广阔,边缘服务器市场潜力也不容小觑。目前,包括联想、戴尔、新华三等国内外服务器厂商,均开始全面布局边缘计算市场,并推出了面向边缘数据中心的不同产品和解决方案,以此来满足不同企业的需求。据Gartner预测,到2025年,全球服务器市场规模将达到1350亿美元,边缘计算设备市场将达到370亿美元。

随着技术的日益成熟,边缘业务应用将更加多样化,越来越多的服务器厂商将面向不同的行业和应用,推出更加多样化的产品,将进一步推动边缘数据中心的高速发展。

人工智能驱动数据中心迈入智能化

利用人工智能构建智能化数据中心,简化数据中心的运维与管理,将成为2024年以及未来数据中心的主流趋势。

未来的数据发展必将走向软件定义,随着数据中心呈现复杂化,人工处理的精力和能力都有限。如果通过人工智能利用其学习能力,对以往管理数据进行智能分析,不但能够实现数据中心的运营自动化、改进资源管理以及提高能源,还可以提供洞察,改善工作负载管理和容量规划等运营决策。

除此之外,人工智能技术还能够通过计算PUE值,根据PUE值反推哪些因素影响数据中心的能耗,再进行针对性地优化,就能够达到降低能耗的目的,提升数据中心运行效率。

可以说,随着在数据中心应用人工智能,能够实现更高效、更安全、更稳定的运营目标,降低人为干预的风险和成本,提高数据中心的整体效率。

责任编辑:张诚 来源: 51CTO

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK