2

云启资本合伙人陈昱:AI大模型突破核心在工程优化,应用落地符合“二八定律”

 1 year ago
source link: http://tech.caijing.com.cn/20230602/4940309.shtml
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

云启资本合伙人陈昱:AI大模型突破核心在工程优化,应用落地符合“二八定律”

21世纪经济报道记者骆轶琪 广州报道

进入大模型发展时期,AI产业被视为进入了“iPhone时刻”甚至将来到“奇点”,诸多行业都将由此被改变。那么对于产业和个人来说,机会将在哪里?

近日举行的2023小蛮腰科技大会暨AIGC人工智能峰会期间,云启资本合伙人陈昱接受21世纪经济报道记者专访时表示,当前还在竞速中的国内AI大模型企业都有发展机会,核心在于不断提升工程优化和技术迭代能力,同时也要充分挖掘创新应用场景。

在他看来,生成式AI落地到应用场景中,将是80%存量应用升级+20%新应用探索的“二八定律”局面。也将给正在演进中的技术,如元宇宙、自动驾驶等,带来渐进式能力推动。

作为早期投资人,在面对AI大模型创业项目时,他看好有野心、懂技术、执行力强的团队。毕竟如今竞争对手众多,如果执行力不够,将很难在这一轮浪潮中跑出成果。据悉,2021年底,云启在天使轮投资的MiniMax,是国内第一家拥有自研多模态大模型的创业公司,目前已开放API接口,和WPS等众多企业合作。

竞速AI大模型

追根溯源,如今火爆全球的ChatGPT背后,是Transformer架构的支撑。这一技术早在2017年被谷歌提出,2018年谷歌还提出基于Transformer架构的BERT技术等。

“其实无论是早期的CNN(卷积神经网络)还是Transformer,都属于在深度学习领域,行业探索过程中寻求的不同网络结构。恰好Open AI用解码器decoder only架构,证明了Transformer的可行性,并把参数规模从十亿扩展到上千亿量级。”他续称,因此这一方面有赖于深度学习算法的持续发展;另一方面英伟达提供的GPU算力支持同样功不可没。

实际上,在早期路径探索中,谷歌认为decoder only路线可能会不如encoder+decoder(编码-解码)效果好,因此采用了另外一条路线,而谷歌内部长期有多个团队在做不同尝试。

最终Open AI持续迭代,加之RLHF(人类反馈强化学习)后,证明了decoder only路线的可行性。随着路线被证明,谷歌很快也推出号称可对标GPT4的大模型PaLM2。

“国内和国外有不同的大模型体系,投身AI大模型的国内企业,当前还是有一定机会。”陈昱对记者分析,目前GPT-4的水平可能已经达到了95分,国内很多产品在80分左右,但是并不存在代际差。

这时候更重要的是,一方面,AI大模型公司需要花费更多时间在工程优化和技术迭代上;另一方面,更需要产品经理的创新能力,充分挖掘AI大模型的创新功能。

“我觉得这一轮,微软在创新应用方面做得比绝大部分公司好,近期微软密集发布新功能,比如在Bing中引入ChatGPT、适用于Windows 11的Windows Copilot等,因此也有声音说,微软的一系列动作要抢了创业公司的饭碗。”他续称。

不过有行业观点认为,Open AI更多是证明了Transformer架构路线的可行性,在具体落地时,或许未必要重投入,而是可以考虑小模型发展路线。

“目前业界存在不同观点。”陈昱对记者分析,一部分人认为,小模型可能存在诸多优势,如资源消耗较少、成本低,而成本低就是跑通商业模型的重要一环;同时,当前“大力出奇迹”的AI大模型中集合了太多数据量和能力,但实际在应用中或许未必需要。

但另一部分人认为,AI公司最终的发展目标都是瞄准通用人工智能(AGI),也即类似人类的大脑,在运转过程中并不会分区,而是可以同时多路线思考运行,甚至各分区之间会互相作用,产生意想不到的效果。这条思路之下,就意味着需要大模型最终“一统江湖”。

总体来看,当前业界对这两条路仍有分歧。“学术上也还没有证明,大模型是否的确是参数量越多越好。毕竟目前AI的运作还是一个黑匣子。”

当然他也认为,并不是所有企业都需要有自己的大模型。“训练大模型要从头开始,这意味着巨大的资源消耗,需要衡量投入产出比。有时调用成熟的大模型,取得的效果可能远比自己从头搭建和训练要好。”他强调,长远来看,综合考虑成本和收益是否算得过来账很重要。

如何改变未来

当前最受关注的,便是在生成式AI浪潮之下,对应用生态和相关底层技术带来的影响。陈昱对记者分析,在应用场景落地中,将是80%存量应用升级+20%新应用探索的局面。

具体来说,数字经济、企业服务/SaaS服务等技术此前已经发展多年,通过引入更好的AI大模型能力,可以将既有技术进一步升级,把之前很难做好的体验真正做到满意;再如微软近期不断对旗下应用进行迭代升级,将极大提升内容生产力和工作效率。这都是由技术变革带来的体验变革。

当然也会诞生新的应用,比如这一轮生成式AI与前一轮预训练模型不同的是,已经能够处理多模态、多语言信息,这将可能给教育、外贸等产业带来新变化;此外,还将有面向开发者的AI解决方案(AI for Developers),可以帮助程序员编写代码、检查安全漏洞等。

生成式AI技术的出现,也将给正在迭代中的技术路线带来一定帮助,比如元宇宙和自动驾驶等。但这总体带来的将是渐进式改变,而非颠覆式驱动。

陈昱对记者分析,AIGC对元宇宙的推动将主要在于素材生成。“元宇宙前期会在这方面花费较多时间,AIGC就可以帮助提高素材生成效率、节省创意时间。”

不过这并不能起到根本性推动作用。“元宇宙一直难以大面积落地,是因为暂时没有刚需的应用场景。AR/VR被视为元宇宙的入口,但目前遇到的难题是,还没有一款眼镜达到可以长期佩戴使用的效果。”他指出。

对于自动驾驶的改善可以包括两方面:感知(perception)和规划(planning)部分。

此前自动驾驶功能运行时,传感器需要不断收集外部信息,进行标注。但有了AI大模型后,由于其具备zero-shot(零样本)能力,可能就不再需要具象到所有可能出现的物体样本进行标记。

而自动驾驶进程中,根据收集到的地图、实时视觉等信息后,该决策是加速、减速还是换道等,就可以运用到AI大模型的推理能力,这将会比现有自动驾驶所用模型做到更好的效果。

对云计算的变化,陈昱指出,AI相关服务用量将激增,短期内会利好英伟达,但长久以后,云厂商可能会发现,与其每年不断向英伟达下订单购买芯片,不如自己开发芯片或和其他芯片厂商合作。

“英伟达的强悍在于开发了一款相对通用的AI芯片,但如果云厂商明确了未来几年都会采用Transformer架构时,那么自己也可以考虑针对Transformer优化一款专有芯片,所以也看到包括谷歌、微软、Meta都有自己的芯片开发计划。”他续称。

AI大模型还在不断渗透到软硬件层面,如近期ChatGPT推出iOS版、百度为此推出硬件产品等。不过陈昱并不认为AI大模型的出现会对既有软硬件生态带来太大角色改变。

我认为改变的可能是搜索生态。”他续称,比如ChatGPT就可能成为谷歌在搜索方面的竞争对手。这意味着对用户使用习惯没有太大改变,改变的只是获取信息的途径。

从社会影响来说,陈昱认为,这将对整个教育体系带来巨变。可以类比此前计算机出现后,复杂的珠算、五位数乘法等学习,到今天多被计算器所取代,人们可以把脑力放在其他更有创造力知识的学习中去。“如果能够利用好AI工具,帮助我们人类完成此前80%的工作,剩下20%可以更好地施展创造力和想象力,同时也会带来新的职业畅想和组织范式。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK