7

又一巨头宣布入局AIGC,一口气开源数个模型,还道出了它的变现之道

 1 year ago
source link: https://www.51cto.com/article/742519.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

又一巨头宣布入局AIGC,一口气开源数个模型,还道出了它的变现之道

作者:金磊 2022-12-16 15:37:15
近期AI圈新贵ChatGPT背后的OpenAI,便是AIGC玩家中非常典型的一位。

本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。

AIGC(AI生成内容),这个概念在今年可以说是火得一塌糊涂。

例如Stable Diffusion,只要对它说一句话,“唰唰唰”地就能秒生成画作。

再如最近大火的ChatGPT,对答如流堪比人类,简直让网友们玩得不亦乐乎。

图片

△左:Stable Diffusion作画;右:ChatGPT作答

而就在这两天,AIGC赛道可谓是又双叒叕热闹了一把。

因为国内一家互联网出海巨头公司宣布——正式入局AIGC。

而且不同于其它玩家的单一路线,它在进军之际,直接是覆盖四大细分领域:AI图像、AI音乐、AI文本和AI编程。

例如在AI图像这件事上,只需要在微信小程序里输入一句话便可秒生成一副作品,而且是中英混着来也hold得住的那种:

一只猫咪eating noodle。

图片

讲真,不仅是在形象方面做到了逼真,就连小猫咪自带的那种小心谨慎且不失可爱的劲儿也刻画了出来。

不仅如此,它还能生成其他多种风格的图片:​

图片
图片
图片
图片

(昆仑天工-天工巧绘 SkyPaint作品,向左滑动查看更多)

AI作曲就更不在话下了,直接上作品欣赏:

Holiday音乐:StarX MusicX Lab - AI作曲 (Explicit)​

d4330fd07fef0c5db588806a4a2aa4c0132b34.jpg

AI文本能力上,给出了一个上联,它便可以秒懂其意给出一个对仗的下联:

图片

不仅如此,聊天、问答、中英互译、内容续写等能力也是不在话下。

再如AI编程,在VS Code上只需简单安装一个插件,光标处按一下“Tab”键,一整段代码便可立即呈上:

图片

“互联网出海巨头”加持、一口气又发布并开源几大模型,这可以说是今年AIGC赛道值得关注的一件大事了。

这个玩家是谁?

不绕弯子,搞出如此大动作的玩家,正是昆仑万维

至于为什么说“值得关注”,可以总结为两点。

第一,就是有技术积累。

昆仑万维实则早在2年前便已经组建了超过200人的团队着手布局AIGC,此次推出的 “昆仑天工”旗下模型包括天工巧绘SkyPaint、天工乐府SkyMusic、天工妙笔SkyText、天工智码SkyCode,已覆盖图像、音乐、文本、编程等多模态内容生成能力。

除此之外,熟悉昆仑万维的朋友都知道,它在2008年成立之初,其业务是以网页游戏为主,包括自研的《三国风云》、《武侠风云》、《千军破》等等。

而后昆仑万维选择了一条进军海外的道路,除了自研之外,还代理运营了《极品飞车:最高通辑2015》、《愤怒的小鸟2》、《皇室战争》等众多风靡全球的游戏。

但说到它的逐步壮大,还要归功于业务和战略的转型,也就是从单一的游戏平台向互联网出海企业升级。

2016年至今,昆仑万维的业务已经形成了海外信息分发及元宇宙平台Opera、海外社交娱乐平台StarX、全球移动游戏平台Ark Games、休闲娱乐平台闲徕互娱、投资板块等五大业务。

也正是在这种多元业务转型的过程中,昆仑万维在现今AIGC所涉及的技术范畴里做到了“量的积累”。

正如我们刚才提到的,昆仑天工所涵盖的内容剑指AIGC四大热门领域,即图像、音乐、文本和编程。那么具体到AIGC各细分领域,昆仑万维所开源发布的模型又处于什么水平?

以昆仑天工AI图像能力为例,据了解,天工巧绘SkyPaint是一款多语言的Stable Diffusion分支模型。

换言之,是在保留了Stable Diffusion对英文文本“理解”能力的同时,增加了其对中文提示词的输入能力。

不仅如此,平行语料库的量级达到了1.5亿级别,包含经常能够用到的中英语料,古诗词中英语料,字幕语料,百科语料,图片文字描述语料等语料库的集合。

在训练方面,则是采用了模型蒸馏方案和双语对齐方案,在使用教师模型对学生模型蒸馏的同时辅以解码器语言对齐任务辅助模型训练。

在实验性能结果上来看,也是优于目前已发布支持多语言的AI图像模型:

图片

AI音乐方面,天工乐府SkyMusic是国内第一款商用级作曲AI模型,该模型引入全局信息约束、和弦隐式表征,和弦准确率达到92.5%,远超目前行业最佳64.7%;支持中文、英文、日文、韩文、法文等31种语种,支持从旋律生成歌词、文案素材生成歌词,且支持全球多曲风。

值得一提的是,天工乐府生成的20首AI音乐已经在美国、韩国、印尼等国家及全球180多个音视频平台发布。

昆仑天工在AI文本生成领域是基于千亿量级的数据集训练,最终构建的140亿参数GPT-3生成模型天工妙笔SkyText。

这个模型的一大特点便是涵盖众多细分任务,包括续写、对话、中英翻译、内容风格生成、推理和诗词对联等等。

不仅如此,从实验性能结果上来看,也是优于目前已开源的GPT中文预训练大模型:

图片

AI编程领域,昆仑天工所提供的则是一款多语言开源编程大模型。

它支持目前众多主流的编程语言,包括Java、JavaScript、C、C++、Python、Go和Shell等。

在其“嵌入”到VS Code中后,便可以实现代码续写,还是给它“喂”一句中文注释即可的那种。

而在AI编程中,模型的生成通过率可以说是非常重要的性能衡量指标之一,而昆仑天工在实验性能结果上依旧表现不俗:

图片

由此可见,昆仑万维在AIGC上的布局并不是一蹴而就的事情,而是在长期发展过程中技术积累后的一种量变。

而“值得关注”的第二点,亦是归于昆仑万维自身——资金实力。

毕竟搞AIGC这件事,单是前期研发投入便需要砸入一大笔资金,并不是小玩家就能“玩得动”的事情。

这一点,从近期披露的财务数据中便可窥知一二。

据昆仑万维发布的2022年半年度业绩来看,单是上半年这六个月,公司便已经实现了22.5亿元的营业收入,整体毛利率水平进一步提高,达到79%。

若是将时间节点拉得更长一些,随着昆仑万维拓展多元业务,并且将人工智能技术不断注入其中,使其各细分业务也产生了较大的变化。

例如Opera浏览器,便从传统浏览器成功向科技驱动的信息分发与元宇宙平台转型,由此带来的营收变化也是肉眼可见。

单是今年上半年,Opera实现营业收入1.5亿美元,同比增长34%,实现经调整后EBITDA 2392万美元,同比增长572%。

截至2022年第三季度,Opera News及元宇宙等新兴业务商业化能力不断提升。其中,云游戏社区GX.Games上线游戏突破2000款,Opera GX月活跃用户超1800万,Opera全球平均月活跃用户达3.21亿。

再如旗下的海外社交娱乐平台StarX,全球注册用户数已超过2.8亿,营收保持强劲增长。Ark Games主打自研的MMORPG新品《圣境之塔》,目前单月最高流水收入已经突破300万美元。

除此之外,昆仑万维在投资领域也斩获颇多。比如最近刚上市的全球最大LGBTQ社交平台Grindr,背后大股东就曾经是昆仑万维,光是这一笔投资就让昆仑万维的收益超过33亿元。

而这一次开源AIGC模型,也是其不断加码科技研发投入的必然结果。

例如在AI图像上,昆仑万维所采用的便是市面上算力最高的显卡集群A100(80G版本),可提供超快速的显存带宽,每秒超过 2 万亿字节,处理超大型模型和数据集。

AI绘画团队对模型训练时间超过了9万个显卡小时,其研发训练所砸的成本可见一斑;不仅如此,在AI文本生成方面,也是通过A100 GPU集群训练得到的最终模型。

据团队透露,昆仑万维自2020年开始布局AIGC开始,便已经投入了数千万元的资金。

有技术积累,有资金研发,而且本身亦是互联网出海巨头,这便是昆仑万维此番动作值得关注的原因了。

而从另一角度来看,昆仑万维的入局也未尝不是对AIGC赛道的一种认可。

因为有实力的玩家们,确实都在迈步于此。

火爆的AIGC赛道

近期AI圈新贵ChatGPT背后的OpenAI,便是AIGC玩家中非常典型的一位。

ChatGPT相当于此前OpenAI提出的GPT的3.5版本,问世5天用户量便达到了100万之多。

而更早一点的Stable Diffusion,也是在仅发布一个月的时间内,其背后的公司便被估值到了69亿元。

这种火爆,未来的市场规模和前景也已经有了推测:

到2030年,AIGC市场规模或将超过万亿人民币。

除了二者之外,国外迈进AIGC领域的巨头玩家不胜枚举,例如谷歌、Meta、英伟达等等,均已将这个赛道视为重点。

而纵观这些玩家的特点,除去拥有充足的研发资金外,还包括有技术、有生态、有落地场景。

反观国内的发展,目前可以说是尚未进入真正的AIGC阶段,这一点在量子位智库的《AIGC/AI生成内容产业展望报告》中有所提及。

虽然在细分赛道上出现了个别优秀的先行公司及研究机构,但目前行业尚未进入大规模验证和体系化发展的阶段。

例如在场景上来看,目前最关键的是内容领域需求较为饱和,且降本增效尚不够迫切。细分来看,虚拟人行业将成为产业中短期增长的关键动力。玩家需要寻找容错率较高、专业度或创意要求有限的场景。

但长期而言,AIGC依旧需要有需求更加清晰且明确的消费落地场景,例如实时性场景(如实时互动、实时反馈类场景)和高度个性化生成场景。

再如玩家方面,国内目前的初创玩家数量较少,大部分细分赛道的初创玩家在5家以下,大部分为具有相关业务大厂/研究机构的内部探索项目。

因为市场规模短期内相对有限,且渠道和前期资源的积累需要较长时间,我们认为后期会更容易出现高行业集中度。
技术方面,除去个别布局较早的企业外,国内AIGC领域大规模稳定生产的能力还需进一步增强,完成从尝鲜式做法向正式和业务化的进入各类场景的转化。

据业内人士估计,预计2-3年内,各AIGC能力有望在成本可控的前提下,实现工业化生产。

最后是在变现方面,尽管国内的Game AI、虚拟人、TTS、结构化文本写作等领域已形成稳定的业务合作关系及收入关系,但行业整体的变现能力仍待进一步证明。且基本为项目制/长期项目制,标准化/平台化产品欠缺发育。

因此,种种分析下来,对于国内AIGC的发展现状,我们可以认为仍旧处于一种尝试阶段,大部分情况下AIGC尚未进入业务场景,变现能力有待增长。

那么接下来需要讨论的一个问题便是:昆仑万维的入局又会带来怎样的改变?

从技术和研发资金等方面来看,正如我们刚才提到的,昆仑万维是具备踏入AIGC门槛的资格。

而从此次开源并发布四大模型来看,昆仑万维要做的重点更是在于推动生态的发展建设,不仅仅是纯做应用那么简单,而是从模型层上出发掌握更多主动权。

首先是从昆仑万维自身维度来看,其在全球平均月活跃用户近4亿,并且已然涉猎的多元业务覆盖AIGC多个重要场景。

这样正是符合国外巨头玩家们“有生态”、“有落地场景”的特点。

不仅如此,对于国内AIGC现阶段最为难解的变现问题,昆仑万维也发表了它的观点:

模型开源后不收费,但可以通过如Mango DB 、Databricks的方法,在商业支持、云服务方面去收费,形成收入来源。
我们的对标公司是Databricks、MongoDB和正在成功的 Stability AI,这些公司在资本市场的市值也不低。
我们坚信开源的迭代速度远远超过闭源,终极目的是让开源云项目起到大厂Saas的补充,给中小企业、中小开发者、普通开发者更好的选择。

那么对于国内AIGC新晋巨头玩家的这套“打法”,你有什么看法呢?

561d9b670e59dd391f94984452c869279ded41.jpg

责任编辑:张燕妮 来源: 量子位

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK