4

大模型狂飙半年,谁能胜出

 1 year ago
source link: https://www.woshipm.com/ai/5860135.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

大模型狂飙半年,谁能胜出

2023-07-04
0 评论 3103 浏览 3 收藏 14 分钟
释放双眼,带上耳机,听听看~!
00:00
00:00

国内外科技巨头或企业都在快速拿出举措,以应对大模型时代的发展。那么在经历了盛况之后,大模型行业又将进入怎样的竞争格局?一起来看看文章的解读和分析吧,或许会对你了解AI大模型行业的发展有所帮助。

7227ad92-d9df-11ed-8d63-00163e0b5ff3.jpg

毫无疑问,当前的科技圈已进入“大模型”时代。含“模”量大到什么程度?但凡科技企业,基本都在做“大模型”。

“从去年12月ChatGPT(Chat Generative Pre-trained Transformer)引爆科技圈之后,几乎所有行业玩家都想抓住这根救命稻草。因为做成了就意味着抓住未来几十年的趋势。”行业创业者夏先生对壹DU财经说道:“ChatGPT是生成式AI,是大模型的落地场景之一。理论上讲,这条路的走通,加速了大模型在短期内的爆发。”

的确,ChatGPT的爆发,让更多人看到了语言模型的魅力。微软、谷歌、百度、阿里等国内外科技巨头快速响应,相继推出自家的AI聊天机器人,试图以To C作为切入口,抢占市场。

风口在哪里,资金和人才就在哪里。随后,先是厂商陆续宣布推出大模型,如百度的文心大模型、阿里的通义大模型、腾讯的行业大模型,后有科技圈曾经的风云人物也开始陆续入场,李开复、王小川、周伯文、王慧文等。出行、认知、办公等一些垂直领域的大模型也相继推出。

半年时间,国内呈现出“群模乱舞”盛况。而在经历喧嚣后,大模型或许是时候回归现实了。

玩家们开始意识到,最初的热闹仅仅是热闹,他们最终的战场在B端市场。此时,多家有着人工智能积累和云计算大厂登台,相继推出了AI大模型服务。

行业老炮和新手创业者的对决,也就此开始了。

一、热情高涨,玩家们跑步入场

进入2023年,大模型技术让科技圈沸腾起来。看到ChatGPT爆发后,不少大厂抓紧时间推出相应产品,新老创业者们着急招兵买马,生怕慢一步就错过了这难得的风口。一级市场关于大模型的投融资热度也在攀升,不少FA开始疯狂补课。

一时间,整个行业热闹非常。

在OpenAI发布GPT4大模型后,第一个采取行动的是百度,在3月16日用“Demo演示”的形式正式发布文心一言。同样在3月,已经沉寂许多的周鸿祎推出大模型产品,甚至连名字都没来得及取。

在此之后,科技巨头、创业公司和高校研究院们展开了一场关于“大模型”的竞速赛。整个4月,都成了“大模型的发布月”,华为、商汤、阿里都在4月份亮出了自己的大模型产品。

到了5月,讯飞推出了自己的星火大模型,并公布了大模型在自己优势领域的诸多应用场景。

创业者们也在火速入场。原美团联合创始人王惠文(目前已退出)、创新工场CEO李开复、前京东AI掌门人周伯文、前阿里技术副总裁贾扬清等开始招兵买马。前搜狗CEO王小川的百川智能拿到5000万美元融资后,甚至扬言:“今年年底做到国内最好的”。

“这波创业热潮有点2000年左右的互联网创业潮的意思。”一位业内人士说道:“似乎每个创业者都想在这个时代找到第二春。”

总体来看,今年上半年,大模型几乎成为所有科技企业的必选项。对于普通人而言,大模型或许是件很遥远的事。毕竟不是每次科技浪潮都能成功靠岸,如元宇宙、XR等行业。

但事实上,大模型的应用更多在B端市场。那么,在行业烈火烹油过后,摆在这些玩家眼前的,理应是他们对市场更多的理性思考。比如市场是否真的需要大模型?大模型真正走向成熟,需要越过哪些重要关卡?能否真正意义上实现商业化。

二、正式开打

大模型军备赛的冲锋号吹响后,整个行业开始“卷”起来。更多玩家已经将视线移至应用层面。因为行业“退烧”后,最终考验的还是玩家们的“硬实力”。

此时,一些在人工智能、云计算上有积累的玩家则占据的先发优势。尤其是模型的参数量。

就目前市场上发布的AI模型来看,虽然大家都自称为“大模型“,但参数量实质是大模型和小模型的界定因素之一。

此前,百度集团副总裁侯震宇在接受媒体采访时曾表示,2022年,10亿参数的模型就叫大模型。但到了眼下,千亿参数以上才会出现“智能涌现”,才会形成泛化能力,才能在各个场景下具备通用能力。

何为“智能涌现”?简单地讲,当模型规模、算力水平超过某个参数阈值后,AI效果将不再是随机概率事件。比如初期语言大模型出现“图不对文”“答非所问”等现象。

并且在通用领域,参数量越大,智能通常涌现的可能性就越大,AI准确率就越高。在垂直领域则更容易获得精确的效果。

今年5月,科技部下属的中国科学技术信息研究所发布的《中国人工智能大模型地图研究报告》统计,截至5月28日,国内10亿级参数规模以上基础大模型至少已发布79个。

大模型狂飙半年,“群模乱舞”谁能胜出

但可以看到,10亿级参数这个量级,很可能不是真正的“分界线”。因为现实的情况是,一些未能达到千亿规模的模型,很难在当前市场的竞争具有竞争力。不过,也不排除一些在垂直领域深耕的玩家,最终能跑出来。

“大模型需要算力、算法和数据积累,绝对不是玩概念的事情,最终还是要市场买单。”夏先生认为,目前来看诸如百度、腾讯、阿里无论是在资源还是积累上,都有一定的优势,“他们在云市场深耕,并在自己擅长的领域积累多年,无论技术层面还是行业积累上,实质已经完成了抢跑,未来就看这些头部玩家如何落地。”

而在投入层面,这会是一个天文数字。

以百度为例。据透露,过去10年,百度在AI方向的投入已超过1000亿元。但大模型不是投一笔钱、做一个模型那么简单,它需要有算力、有数据、有经验丰富的AI工程师在好的研发平台上长期积累。

而创业公司如果直接去做基础大模型,除了上述投入之外,还需要能够把模型、算力管理好的AI开发平台。

这意味着,创业公司不论是自建开发平台,还是采购外包平台,其投入都不会是小数目。并且,大模型不是预训练出来就好,更需要后续持续敏捷迭代。从这一点看,创业公司所受的限制明显要高于大公司。

但大厂很难留住强算法人才的弊端也比较突出,因为大模型投入是一件长期主义的事,必定会面临与既有业务之间的冲突。这一点,从大厂出走的大模型创业者的经历,就说明了一点。长期主义对创业公司同样重要,无论是创始人的背景背书,还是资源合作,抑或是客户的拓展,都需要长期积淀。

三、行业竞赛即将鸣枪

人工智能专家侯世达的学生梅拉妮·米歇尔《AI 3.0时代》一书中提到,研究人工智能与赛道中的创业者们都熟悉了一种模式——先是“人工智能的春天”,紧接着是过度的承诺和媒体炒作,接下来便是“人工智能的寒冬”。并且,他认为这一模式将以五到十年为周期不断上演。

具体到2023年上半年的大模型赛道,显然其正处于第二个阶段——行业很火,市场很热。这一周期往往是最短的,也通常意味着如此去泡沫化后,赛道竞争即将正式开始。

大模型比拼的不仅仅是技术,还应该将重点放在大模型应用、产业生态中去评估。

目前,市场上大模型的玩家主要分三类。

一是聚焦基础层,主要对标OpenAI,发挥基础设施的作用。

第二类是锚定中间层,不需要像OpenAI一样花大钱做底层,只需要掌握通用化能力,就可以通过开源大模型做精调,让模型具备差异化能力,最终可以形成垂直类模型。

第三类是调用大模型API的企业,专注开发大模型具体场景的应用,如Jasper。

相对而言,前两类又是大模型的“基础设施”,因为有极高的门槛,对技术、资金以及资源有严格的准入壁垒,往往是大公司布局的主要方向。

目前来看,百度、阿里和华为在大模型的构建上,不约而同地采用了“模型+工具平台+生态”的三层共建模式。腾讯云则更专注于应用层而,6月19日公布的腾讯云MaaS服务解决方案即覆盖了金融、文旅、政务、教育等10个行业、超50个解决方案。

大模型狂飙半年,“群模乱舞”谁能胜出

虽然巨头们参与竞争的姿势不同,但目标实质上只有一个,那就是打通应用层。在百度创始人李彦宏看来,应用层最具想象空间。

商汤科技联合创始人杨帆认为,AI 基础设施本质上还是算力、数据、基础算法,包括算法相关的工具,本质上还是三位一体的东西。最后谁能把这三者的整合能力提供的好,提供更低成本、更低门槛的能力是决定整个竞争最重要的点。

AI大模型是人工智能迈向通用智能的里程碑式技术,因为其可为各行各业的智能化升级提供强劲的生产力工具。在千行百业数字化转型升级的当下,大模型的重要意义不言而喻。也因此,在当下,谁能率先在赛道里抢到更多筹码,就非常关键了。可以预料,未来,抛开“基础设施”层面的较量外,真正的战场大概率是各行各业的切实落地上。

作者:Apple,编辑:亦可

原文标题:大模型狂飙半年,“群模乱舞”谁能胜出

来源公众号:壹DU财经(ID:yiducaijing2021),多一度热爱,深一度观察。

本文由人人都是产品经理合作媒体 @壹DU财经 授权发布,未经许可,禁止转载。

题图来自 Unsplash,基于 CC0 协议。

该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK