5

大厂「卷」上云,字节跳得快!

 2 years ago
source link: https://3g.163.com/dy/article/GQHRIAHK0511ABV6.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

大厂「卷」上云,字节跳得快!

2021-12-06 14:33 新智元

新智元报道

编辑:好困 桃子

【新智元导读】「假面骑士变装」这款AI特效再次戳中许多少女心。殊不知,能够让你玩到爆的这些特效背靠一个强大的AI引擎

女生帅起来或许就没有男生什么事儿了...

想必你应该也玩过这个「女变男」特效。

从头发到整个面部表情,画风大转变,这不就是我爸年轻的时候!

还有假面骑士变装,无缝变身,没有丝毫的违和感。

其实,能够让你玩到爆的这些特效背靠一个强大的AI引擎。

特效背后支撑全在这儿

12月2日,火山引擎召开了一场主题为「新云·共未来」的云产品发布会,正式对外发布了全系云产品。

其中包括云基础、视频及内容分发、数据中台、开发中台、人工智能等5大类,共计78项服务,构成了从IaaS到PaaS、再到SaaS的完整产品体系。

基于字节大规模实践和技术创新,火山引擎提供了从基础硬件到业务场景的端到端性能优化。

以其定制化数据中心为例,平均PUE(总能耗/IT设备能耗)仅为1.16,远低于全球大规模数据中心1.59的PUE均值。

在云基础架构上,火山引擎坚持全栈自研、软硬一体的协同设计,覆盖了计算、存储、网络等各环节。

字节跳动自研的服务器、DPU(专用处理器)、AI芯片等硬件,将通过火山引擎云产品对外服务。

开放字节内部大资源池的共享计算,也是火山引擎云极具性价比的关键因素。

客户使用火山引擎的云,就是使用字节跳动同源的基础架构,既保障了稳定性,又可以通过混合调度提高资源利用率,显著降低成本。

而在人工智能领域,火山引擎主要提供AI开放平台和AI开发平台两大产品系列。

开放平台

特效做得好,CV少不了。

前几天,何恺明最新提出的 MAE 模型成为CV圈的焦点,将NLP领域大获成功的自监督预训练模式用在了计算机视觉任务上,效果拔群。

同样,在最新一篇论文中,字节与其他机构组成的联合团队提出了适用于视觉任务的大规模预训练方法iBOT。

论文地址:https://arxiv.org/pdf/2111.07832.pdf

iBOT通过对图像使用在线tokenizer进行BERT式预训练让CV模型获得通用广泛的特征表达能力,并在十几类任务和数据集上刷新了SOTA,甚至在一些指标上超过了MAE。

线性分类方面,iBOT在ImageNet-1K上取得了81.6%的准确度,也是目前最高的结果。

微调方面,iBOT在使用ImageNet-1K作为预训练数据时达到了83.8%准确率,高于MAE的83.6%。

而使用ImageNet-22K作为预训练数据时,准确率可以达到更高的86.3%,同样超过了此前的SOTA。

在NLP方向,字节跳动摘得了ACL 2021唯一一篇最佳论文(best paper)的桂冠。

同时也是ACL成立59年以来,中国科学家团队第2次摘得最高奖项!

这篇题目为「Vocabulary Learning via Optimal Transport for Machine Translation」的获奖论文,提出了一种新的词表学习方案VOLT,并在多种翻译任务上取得了优秀的结果。

论文地址:https://arxiv.org/abs/2012.15671

以目前主流词表BPE为例,业界普遍会通过大量自然语言处理下游任务的训练以寻找最优大小。

相比之下,使用VOLT方案可以节省大约92%的算力,不仅显著地提高了训练的效率,而且还极大地降低了训练成本。

ACL的评审一致认为:

字节跳动的VOLT方案对机器翻译中一个重要问题提出了有效且新颖的解决方案,能显著减少词表的学习和搜索时间,相信其不仅会在研究界产生重要影响,在工业应用方面也有着巨大潜力。

那么,有了这些字节跳动在AI技术上的深耕,火山引擎AI开放平台的能力自然也有了强力的保障。

比如在抖音上看到的各种风格化特效,其中,一个特效从数据生成到模型训练,需要大量的数据和改动才能达到预想的效果,所以这些特效的生产需要大量的数据、算力和人员投入。

而通过火山引擎的AI能力,抖音在不断优化特效的生产流程,做到了生产效率提升了4倍,人力成本、机器成本、数据投入都下降了很多,过程中还极大提升了生产的扩展能力。

概括来说,火山引擎AI开放平台拥有4大特性:

  1. 包含视觉、语音和语义三大领域,共计八类产品,开放出一百多项服务;

  2. 所有能力经过字节跳动的上线要求和场景验证,并且开放出众多的同款和特色能力;

  3. 内外需求同时驱动,以双周进行模型更新或服务上新;

  4. 提供体验中心快速体验、多语言参考代码快速接入,提供7x24小时在线支持。

利用开放平台提供的AI底层和基础能力,便能满足多个行业、场景的服务个性化需求。

开发平台

除了供现成能力的AI开放平台提之外,火山引擎还打造了AI开发平台,为自动驾驶、工业检测等对AI模型的需求很大的领域提供一站式、高性能和高效率的生产力工具。

在这次发布会上,火山引擎首次展示了与轻舟智航联手打造的自动驾驶工具链轻舟矩阵。

通过RDMA网络直连的数万张GPU,以及自研的BytePS分布式训练框架,火山引擎极致地压榨GPU的算力和通信宽带,让主流模型的多机加速效率超过了90%。

同时,通过资源池化和在离线一体化调度技术,最大程度地减少资源的闲置时间。

依托火山引擎AI开发平台,轻舟矩阵上的自动驾驶模型训练GPU利用率可提升30%。

此外,轻舟矩阵还能够依托真实路测与生成数据构建仿真场景,不仅将测试成本降至纯道路测试的1%,还可以生成数百万个的Corner Case场景。

每天完成数百万次算法训练、测试验证和迭代优化,使得自动驾驶软件能力的进化不再受车辆和人员的限制,一周内即可高效测试验证量产级别的算法版本,实现车辆智能化水平的持续快速提升。

开火山引擎的AI开发平台为算法工程师提供高效的运算资源管理、极致的算法开发体验和成熟的模型能力。

通过与IaaS深度融合而实现的极高性能,比如单个用户每秒可达数百GB的吞吐,数千个计算实例同时访问的高性能共享存储,以及PB级别的容量。

通过与PaaS深度融合而提升的资源利用率,基于k8s自研的调度框架和更优的binpack算法,GPU的利用率得到了大幅提升。

通过一站式服务和多种接入方式,用户代码无需改动即可云上运行,代码在平台内和平台外都可以直接复用,1小时内完成测试接入。

AI开发平台提供了100多种优质且独家能力,包括人像特效、音频技术等,而且还有字节跳动的「同款」模型哦。

此外,AI开发平台还提供了 4项创新性的服务 :

  1. 超大规模分布式训练

支持运行超大规模的分布式任务,包含多种预置算法框架和自定义算法框架。提供稳定、灵活、高性能的机器学习训练环境。

  1. 多框架高性能推理

支持多种框架的模型在异构硬件上的一键部署,具有高吞吐、低延时、实时扩缩容等特点,使推理服务更具弹性和容错性。

  1. 高性价比算力资源

支持资源组内配额分配、任务管理、查看资源利用率等功能,提升整体资源利用率。

  1. 高效率开发调试工具

通过结合弹性资源以及与分布式训练时相同的环境,云端机器学习开发环境WebIDE可以极大提升开发和调试的效率。此外,WebIDE还支持端云协同开发环境,可以从本地环境一键发起并管理训练任务。

火山引擎拥有如此强大能力的背后,是字节跳动的两大「法宝」:「敏捷开发」和「数据驱动」。

春晚红包雨,27天战果

2月11日除夕夜,抖音在春晚期间撒了12亿红包,为全国人民送上了牛年的诚挚祝福。

5轮红包雨,超700亿次互动,直播间498.46万用户同时在线,活动全过程只能用4个字来形容:极致丝滑。

抖音当晚面不改色地撑下了这个场子。殊不知, 这背后是火山引擎团队备战27天的战果 。

在「新云·共未来」火山引擎云产品发布会上,字节跳动副总裁、火山引擎业务负责人杨震原讲道,「去年距离除夕只有27天的时候,我们顺利完成了这个工作。而在以前,这类活动一般都会有3个月的准备时间。」

其实,春晚红包活动核心是对峰值流量的预估、资源调度优化及用户体验保障。

技术团队从流量治理、服务治理、研发效能等多角度入手,结合火山引擎云原生能力,给出了有字节特色的解决方案。

字节跳动副总裁杨震原认为, 「敏捷」是企业在移动互联网时代的重要竞争力 。字节跳动以敏捷为核心目标构建了云原生架构,支撑着公司业务快速创新、快速迭代。

早在2014年的时候,字节跳动就确立了在IT基础建设上的核心目标「敏捷」。

为了实现这一目标,云原生的实现可以从两个方面入手,用容器化进行部署以及用微服务进行构建。

容器被称为代码「集装箱」,负责代码部署、隔离、资源分配等任务,微服务则是将复杂的应用拆分为微小的服务单元。

从开发上就可以有利于快速地变更,这些服务单元能够在众多的业务系统中灵活组合,并支持多人并行开发。

如今,字节已经实现每天新增1500个AB实验和2万次线上变更,3周完成设计和上线新App等等。

当然了,除敏捷以外,还需要考虑到稳定性和综合成本,比如运维的复杂度等等。

不能为了做得快,而无限制地增加成本。

那么,字节跳动又是如何在这几点之间找到平衡的呢?

内卷云时代,火山靠什么搏出位?

2021年被称为 「多云之年」 。

云服务的概念自2006年提出以来,如今已经进入到了广泛应用的阶段,越来越多的企业、政府以及开发者开始在云端进行各种网站建设、计算以及开发工作。

《2021年云状态报告》数据显示, 92%的企业正在采用多云战略,受访者平均使用2.6朵公有云 。

另外,根据艾瑞发布的《中国基础云服务行业数据报告》显示,在To B领域,云市场集中度在持续提升,2020年中国前五大云服务商已经占据了75%的市场份额,前十大则占据了90%。

诸如阿里云、腾讯云以及华为云等大型云服务商多年来在市场上凭借着其稳定性、技术积淀以及在功能服务上积累的口碑成为了众多企业「上云」的首选供应商。

但与此同时,《报告》对于云服务市场规模和增速有着大胆的预测:预计在2024年,中国云服务市场规模将有望达到9286亿。

可以看出, 上云成为当前社会发展不可扭转的趋势 。

或许你会发出疑问,国内云市场已有三足鼎立之势, 除了在性价比上打动客户以外,字节的「打法」是什么?

答案除了云开放、云互联,积极拥抱「多云时代」。

火山引擎总经理谭待介绍说,火山引擎的云原生架构,不仅能够更好地屏蔽底层细节,帮助客户实施多云战略,也能进一步加速上层业务的迭代效率。

在谭待看来, 企业客户的需求复杂多样,任何一家云厂商都无法大包大揽 。因此火山引擎会坚持云生态开放的策略,在SaaS层只做自己擅长的事,包括个性化推荐、智能创作、智能体验等字节内部有着丰富实践的服务,其他的服务则会由合作伙伴来提供。

火山引擎在产品中也践行着开放理念,此次发布会重点介绍了两款产品: 一是云原生化研发平台veCompass ,在多云底座上提供敏捷开发服务,具备DevOps、运维观测、服务网格等丰富功能; 二是云原生数仓ByteHouse ,为客户提供提供云中立、多租户、计算存储分离的数仓分析服务。

这两款多云产品刚好覆盖了企业研发和数据分析的两大核心场景。未来,火山引擎也将逐步开放更多的多云原生工具,帮助企业更便捷、更平等地使用云计算服务。

自2020年6月上线以来,火山引擎从SaaS和PaaS层应用生态出发,将字节跳动的技术工具对外开放,目前服务的行业有互联网、手机、金融、汽车、先进制造等。

未来,为了建设开放的云生态,火山引擎宣布推出 「万有计划」 ,目标是在未来3年联合一千家合作伙伴、助力十万家客户实现数字化转型。

在这场云的马拉松比赛中,火山引擎以十年为期,我们拭目以待。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK