2

做不出GPT,字节云曲线救国

 1 year ago
source link: https://www.qianzhan.com/analyst/detail/329/230424-d6efa7f0.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

做不出GPT,字节云曲线救国

• 2023-04-24 13:30:38  来源:科技新知 E378G0
1

图源;摄图网

作者|樟稻 来源|科技新知(ID:kejixinzhi)

火山引擎的大模型训练云野望。

“大语言模型改变云计算游戏规则”,李彦宏的这则断言,愈发成为云计算行业的共识。

可以从两方面来解释这种新变化。一方面,大语言模型在训练和推理过程中需要大量的计算资源,即算力。而这些需求催生了云计算厂商为模型训练提供更强大、更高效的计算资源。

作为佐证,投资机构A16Z认为,生成式AI市场里的大量资金,其实最终流向了基础设施公司。

A16Z估计,应用公司平均将约20%-40%的年收入,用于推理和定制化的微调。这部分通常直接支付给云服务提供商,以获取实例或支付给第三方模型提供商,而后者将大约一半的收入投入于云基础设施。据此有理由推测,生成式AI总营收的10%-20%将流向云服务提供商。

不仅如此,A16Z估算,许多拥有自家模型的初创公司已筹集到数十亿美元的风险投资,其中大部分资金(在早期阶段高达80%-90%),通常会支付给云服务提供商。这可是流向云厂商的“一大笔钱”。

另一方面,大语言模型的兴起,让许多复杂任务可以通过预训练模型来解决。企业无需拥有庞大的技术团队和资源,就能利用云计算服务快速实现AI应用。

简单来说,模型即服务(Model as a Service,MaaS)将成为新的云计算服务形式。企业可以通过API调用预训练模型来满足自身业务需求,而这降低了云计算服务的使用门槛。

微软是最典型的案例。眼下,Azure OpenAI服务已经普遍可用,企业可以申请访问包括GPT-3.5、Codex和DALL・E 2在内的人工智能模型。目前,已经使用Azure OpenAI的客户有半导电视台、毕马威、RPA厂商Moveworks等等。

得益于上述新变化,国内云计算行业迎来新的发展契机和活力,特别是在如今的低增长速度背景下,更加鼓舞人心。

此前,市场研究机构IDC在2022年底的预测报告中,将中国云计算行业未来五年的平均增长速度下调了10%。这是考虑到互联网行业整体增速放缓的影响,同时政企集成业务也在调整过程中。多方因素共同导致了互联网云厂商普遍降低了业务预期。

从这个角度出发,便能理解为何众多云服务厂商,如此热衷于成为国内大模型热潮中的舵手。

01

“卖铲子”的火山引擎

当前,大模型成为科技领域最热门的话题。在中国,至少有数十家企业和机构已经发布了大模型产品或公布了相关计划。作为互联网领域的翘楚,字节跳动自然不会缺席这场AI竞赛。

据《晚点LatePost》报道,面对ChatGPT和背后的大模型机会,张一鸣选择亲自跟进。一位字节人士称,张一鸣近期时常会和一些字节人士分享论文学习心得和对ChatGPT的思考。

据了解,字节今年初才开始组建专门的大模型团队,但一把手的跟进也意味着诸多资源倾斜。果不其然,近日,在BAT先后展示自己在大模型产品领域的进展后,字节终于亮出了自己手中“另类”的牌。

字节跳动旗下云服务平台火山引擎举办的“原动力大会”上,火山引擎总裁谭待表示,火山引擎不做大模型,而是服务客户做好大模型,为企业和消费者提供更丰富的AI应用。

进一步解读,眼下国内很多科技公司投入到大模型建设中,火山引擎要做的就是为大模型客户提供高稳定性和高性价比的AI基础设施。

曾经的北美淘金热时期,寻找黄金的人们需要购买铲子等必备工具,而出售这些商品的商人赚取了可观的利润。在现代商业环境中,“卖铲子”这一说法常常用于形容为他人提供工具、服务或基础设施的公司,而非直接参与某个行业的竞争。火山引擎此次想做的便是在大模型热潮中“卖铲子”。

后续的宣传环节中,有两个噱头十分玩味。一是,火山引擎宣称,中国的大模型领域,七成以上已是其客户。面对媒体群访,谭待解释道,上述“七成”是火山引擎相关客户与第三方机构统计的大模型企业数量之比,能获得这么多客户是因为机器学习平台解决了算力辅助的问题。

二是,为了让更多潜在客户安心,谭待在多个场合公开表示,火山引擎不做大模型。“我们不急于推出一个只有30分且只能适用于本地部署的大模型,这不是最关键的,核心是赋能其他人做这件事情。”

这几乎是公然叫嚣其他大模型参与者,特别是前不久刚刚放言“不用造轮子”的云厂商们。

拿阿里云来说,此前的云峰会上宣传口径是,阿里云希望帮助更多企业用上大模型,让每家企业都能基于“通义千问”,拥有具备自己行业能力的专属大模型。换句话说,在阿里巴巴提供的算力基础设施、机器学习平台以及大模型服务的支持下,企业们不再需要浪费时间和精力去“造轮子”,或是陷入针对大模型通用能力的无谓竞争。

百度也是同道中人。李彦宏认为自家三月发布的文心一言距离GPT的差距大概在两个月,并且认为国内大模型创业已经基本没有机会,大家也没必要在大模型上重复造轮子。为此,还引发了王小川的揶揄。

在阿里、百度先后公布大模型策略后,火山引擎拿出更低的姿态,显然是在丢掉时机优势后,寄希望于弯道超车。毕竟,哪个创业者没有成为中国OpenAI的梦呢?

02

字节云需要更多王小川

“卖铲子”商业模式的核心,是鼓吹更多淘金者加入。

历史上,加州淘金热期间,当地报纸发表了关于在若干地点发现金子的文章,迅速引发了广泛的关注。一些商人和企业便利用淘金热来推广他们的产品和服务。例如,邮轮公司和铁路公司为了吸引更多的乘客,大肆宣传推销前往淘金地区的船票和车票。

放到此次大模型热潮中,火山引擎想要靠“卖铲子”发家致富,自然需要站在“王小川们”这一边。

为此,火山引擎造了“多云多模态”这个概念。谭待表示,在大模型及下游应用发展推动下,无论传统企业还是初创企业,对AI算力都有迫切需求,企业使用多家云服务将成为常态。同时,各行业有自己高质量的私有语料,大模型不会一家独大,而是会在千行百业生长,形成多模型共生甚至协作的生态。“未来将是‘多云多模型’的时代。”

对于该论断,王慧文(美团联合创始人)、贾扬清(原阿里技术副总裁)、周伯文(原京东高级副总裁)、李岩(快手前 MMU 负责人)、闫俊杰(原商汤科技副总裁)等创业者肯定赞同。

不过,这里也还有一些不确定因素。其一,王小川等创业者一定会用火山引擎卖的“铲子”吗?

简单来说,火山引擎主要是为大模型客户提供AI基础设施,可以理解为AI算力需求。而对于算力需求,王小川并没有直言通过云厂商来满足。

此前在参访中,王小川认为中国可以购买的英伟达A800和A100芯片性能差距只有5%,目前不会成为“卡脖子”的瓶颈,尤其对未来国产芯片有一定技术突破特别有信心。

简单来说,对于王小川等创业者而言,是否“借道”云厂商们犹未可知。

其二,火山引擎是否会坚守不涉及大模型的立场?

据《晚点 LatePost》披露,目前参与字节大模型的技术负责人有朱文佳、项亮、李航等,他们分属字节多个部门。其中项亮、李航向火山引擎BU负责人杨震原汇报。

对于要不要做大模型,杨震源曾回应称字节跳动对大模型也在做一些学习和研究,现在还没有什么结果,也没有大模型产品落地时间表。从这里来看,火山引擎并没有宣传中那样坚定路线。毕竟不做大模型,直接意味着云厂商少了模型及服务这条营收支线。

从这次整个宣传动作来看,火山引擎延续了一直以来的策略。此前,作为云市场的后来者,火山引擎的目标是做阿里云、腾讯云、华为云之外的“第四朵云”。

对此,多云成为火山引擎反复强调的一个宣传点。RightScale在2019年对全球企业用云策略的调查显示,超过1000人的大型企业中,选择多云部署的占比达到84%,其中混合云占比达到58%。这种多云策略,或是字节跳动扩大市场份额的转机。

而这次,火山引擎在多云的基础上还加上了多模态。

不过,根据IDC最近发布的《中国公有云服务市场(2022上半年)跟踪报告》显示,2022年上半年,阿里云、华为云、天翼云、腾讯云和AWS这五大云厂商一直占据了70%以上的市场份额。火山引擎仍然处于名不见经传的其他厂商(Others)之列。

显然,在这个已经相对成熟的云市场中,火山引擎想要突围并不容易。后发者想要颠覆格局,天时地利人和缺一不可,大模型热潮可以看作机会窗口打开,但结局到底如何还要取决于字节团队的深耕细作。

编者按:本文转载自微信公众号:科技新知(ID:kejixinzhi),作者:樟稻 

本文来源科技新知,内容仅代表作者本人观点,不代表前瞻网的立场。本站只提供参考并不构成任何投资及应用建议。(若存在内容、版权或其它问题,请联系:[email protected]) 品牌合作与广告投放请联系:0755-33015062 或 [email protected]

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK