23

开放计算项目:2020年重点路线图

 4 years ago
source link: https://www.sdnlab.com/23744.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

很多人经常问开放计算项目(OCP)基金会的工作人员OCP的路线图。本文将重点回答该问题,并对重点领域提供更好的见解。众所周知,OCP是一个开源社区,所有技术内容均来自其成员。从去年开始,董事会、技术顾问和志愿者领导层发现在该行业存在大量(15个以上)机会。在这些机会中,开源社区可以加速开发关键垂直领域的解决方案,如超大型企业、电信公司和Edge。上个月,随着新技术领导人的加入,OCP社区再次确认了他们的首要任务。他们是:

12open_compute_project_logo_horiz-100068653-large.png

通用平台

十年来,云产业一直在转型的路上。交换机设备和服务器硬件的分离使得采用开源和白盒硬件解决方案成为可能。OCP社区已经从行业中不断创新的大型基础设施建设者那里看到了效率和规模方面的巨大突破。这一转变也突出了对“操作相似”计算平台的需求。在这些平台上,物理、逻辑和编程接口需要保持一致,同时还要支持最新技术。例如,NUMA(或非NUMA)内存或缓存一致性应体现在在多代技术中。

通用平台方法可为所有采用者提供可扩展,高效的设计,并且特别适合大型企业和电信运营商(提供私有云服务的运营商)。这些运营商可使用世界上最大的服务提供商开发的技术和产品。通用平台概念将理想地支持模块化、硬件管理和安全性的标准化以及开放系统固件。

在2019年,开放式加速器基础设施(OAI)项目将定义并启用通用的构建块,这些构建块将提供可扩展的、用于学习和推理的AI硬件。Edge项目已于2019年启动,为部署在数据中心外部的延迟敏感应用程序定义新接口,并启用了通用存储模块和底座。

展望未来,通用平台还应定义可管理性、安全性和系统初始化,并应包含可以延长基础设计使用寿命的新兴接口。除OCP之外,还有一些组织正在定义和启用新接口,这些接口将为通用平台增添价值。OCP将尽可能与这些组织合作,以协作、定义、升级和启用接口。基金会工作人员还将探索在社区内共同举办活动和启动新项目的机会。

模块化

服务器需求的大部分将继续是通用设备,虽然面向GPU和AI的工作负载在数据中心的增长率很高,但它们并没有部署在每台服务器上。由于集成电路工艺特性尺寸和时钟速度的限制,摩尔定律已经终结。不过,打包和指令集以及公共云可用性带来的性能改进将为通用工作负载提供必需的性能。但对于某些工作负载,特定领域的体系结构和深度学习体系结构比通用处理器或软件解决方案的性能提高了10到1000倍。

接口的模块化和标准化可保护硬件和软件投资,允许后期配置决策,并加速采用和部署最新最好的硬件技术。这些硬件解决方案(例如加速器)应该作为模块实现,以允许通用平台提供主机服务(电气互连、机械、冷却、电源、协议)。

模块化价值的最好例子是OCP Mezzanine card。从2012年Facebook发布的最初规范开始,OCP社区开始采用模块化,现在它已经成为IO选项的事实上的标准。2019年,十多家公司共同编写了3.0 NIC规范,并在阿姆斯特丹举行的2019年区域峰会上,供应商展示了200Gbps的数据传输。在2019年,Open Accelerator Module(OAM)项目和Open Domain Specific Architecture(ODSA)项目都将模块化视为实现各个技术的最佳计划。还为开发分类服务器体系结构做出了一些贡献,例如FaceBook Big Sur GPU扩展和Project Olympus FX-16 Flash扩展。

展望未来,OCP社区希望在设备、子组件、平台和机架级别采用模块化。存储设备形式因素的激增也表明需要在考虑模块化的基础上进行更好的协作。模块化的理想候选产品包括电源架、电信IO和边缘设备的推理硬件。模块化可以应用于具有新机架标准(例如Open Rack版本3.0)和高级冷却解决方案的机架。

开放式固件解决方案和平台安全性

随着可编程设备在整个网络中以及设备之间和内部的增长,安全威胁的范围不断扩大。部署在连接的设备上的专有软件为恶意攻击创造了机会,并造成了组件上的漏洞。

提供 Root-of-trust硬件需附带通用的API。完整的开源固件堆栈可显著减少恶意攻击和降低安全风险。

到2021年3月,所有OCP平台都需要提供开放源代码存储库,这些存储库使任何用户都可以将开放系统固件构建和部署到OCP认可的产品上。

硬件管理

超大规模供应商拥有自己的固件和软件,可远程管理其IT设备。他们可以根据自己的需求变化和从设备中收集有用的遥测数据来改进解决方案。对于私有云提供商(例如大型企业和电信),大多数依赖于设备OEM提供的IPMI接口或工具集。由于超大规模供应商的能力发展不平衡,所有供应商都需要一个可互操作的系统管理框架。幸运的是,由于DMTF.org的努力,框架定义已经到位。DMTF的Redfish®是一个标准,旨在为聚合、混合IT和软件定义的数据中心提供简单、安全的管理。

展望未来,OCP的定位是规定所有OCP设计和规范应符合Redfish标准的基线配置文件,以实现所有OCP认可产品的互操作性和可管理性。BMC固件和RMC固件的开放源代码存储库将是未来的必需。

综合解决方案

如上所述,云产业已经走过了十多年的转型之路。交换机设备和服务器硬件的解耦使企业能够采用任何开源的软件堆栈和白盒硬件解决方案。这种模式适用于那些有资源来构建和支持软件堆栈的公司,但是大多数公司都希望其供应链和系统集成商为这项工作提供资源。

OCP集成解决方案使公司能够采用在OCP Accepted™和OCP Inspired™硬件上运行的可靠解决方案堆栈,从而为企业提供融合的基础架构解决方案。这些托管产品展示了软件产品的不同组合,支持不同的机架形状。所有OCP集成解决方案都提供了经验证的支持服务,包括第三方产品支持,以确保高效、可靠和可扩展的工作负载部署。

展望未来,OCP将专注于实现和推广解决方案,并增加解决方案提供商的数量,以及这些解决方案的维护和支持来源。重组工作也将通过与开放网络基金会(ONF)、电信基础设施项目(TIP)、开放网络用户组(ONUG)和其他用户驱动的组织合作来完成。

上述只是2020年OCP重点路线图的一部分,在网络光学、系统初始化的新方法、云硬件的服务模型等方面,大家可以期待看到更多的活动和协作。

原文链接:https://www.opencompute.org/blog/open-compute-project-2020-area-of-focus-roadmap


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK