10

我们和第四范式戴文渊聊了聊他们的大模型 | 智识

 1 year ago
source link: https://www.chinaventure.com.cn/news/114-20230427-374959.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

我们和第四范式戴文渊聊了聊他们的大模型 | 智识

第四范式准备如何迎战接下来的大模型时代?

4月26日,第四范式首次向公众展示其大模型产品式说3.0,并首次提出AIGS战略(AI-Generated Software):以生成式AI重构企业软件。

巧合的是,前后脚,第四范式又一次递交了招股书。招股书显示,第四范式就是一家专注于企业级人工智能的软件公司,致力于提供以平台为核心的解决方案,使企业能够开发自己的决策类人工智能应用。

招股书中也披露,早在今年2月底,第四范式就已经推出了一个专为业务场景设计的企业级生成式人工智能产品SageGPT,布局大模型AI产品。

第四范式创始人兼CEO戴文渊解释了布局上述AIGS的原因。以前这些B端软件极为复杂的交互体验,以及复杂性带来的极低开发效率,恰恰为生成式AI留下足够大的重构和改造空间。

在其背后,招股书也显示,2020年至2022年,第四范式服务的标杆客户数分别为47家、75家和104家;每名标杆客户的平均收入分别约为1230万元、1370万元和1790万元。2022年的总营收为31亿。

那么恰逢生成式AI又掀起的新一轮AI浪潮中,第四范式准备推出怎样大模型,又准备如何迎战接下来的大模型时代?

借此机会,投中网和戴文渊深入地聊了聊:

2个月前,就已经发布了大模型产品

投中网:在刚刚递交的招股书中,显示2月第四范式已经开始在做大模型了?

戴文渊:2月底我们发布了式说1.0,跟此次要发布的式说3.0,两个月左右时间,基于当下很快的迭代速度,两者就已经不能再同日而语了。

投中网:所以2月底发布的是什么大模型?当下对外发布的又是什么大模型?

戴文渊:第四范式希望可以用生成式AI来重构企业软件,也把自身定位为基于多模态大模型的新型开发平台,提升企业软件的体验和开发效率,从而实现AIGS。

这就需要三个非常重要的能力:知识库、Copilot(副驾舱)和思维链CoT(chain of thoughts,多步推理)的能力。此前的版本,我们只是先做了知识库、Copilot的能力,到现在,才把后三者真正融合进来。

投中网:巧合的是,2月正好是ChatGPT在国内开始风靡的时候。

戴文渊:1月底2月初,ChatGPT已经在国内掀起了比较大的浪潮。但说实话,一个可以被推向市场的产品,不太可能是只花了一个多月的时间就能做出来的。

我们有个大概百人的研究院,一直在做范式未来产品的探索,所以也一直在大模型上有投入,只是肯定没有到达OpenAI投入的这个量级,所以我们也才能按照自己的时间节点谋划自己的产品线。

早在2018年BERT(模型)时期,我们已经开始做相关工作,彼时BERT还有一定的局限性,等到GPT3出来,大家已经基本上看清楚技术路线的发展方向了。未知的只有临界点真正的时间点是什么。

实话实说,没预料到GPT突然就在这样的时间节点爆发了,这比我们之前预想的要提前,本来我以为自己已经相对乐观,但发现到2月底的时候,随着GPT出圈,大家的信心指数都已经爆棚了。

不过变化更多只是来自于市场侧,技术的发展一直是线性的,不太可能突然有特别大节点性的变化。

投中网:那为什么没有在2月直接宣布第四范式已经在做大模型了?

戴文渊:我还是希望可能我们原本有10项能力,现在有2项能力可以先产品化,先做成可以面向市场和客户的产品,这个层面宣布与否没有特别大的影响。

投中网:整体进程会受两个月内很多人都跳出来做大模型的影响么?

戴文渊:我们对于未来有自己的判断,更倾向于怎么把自己看到的市场和所要解决的问题,一步步地解决掉。唯一的区别在于,我们确实没想到市场突然被打开,我们就需要在此时此刻把这些产品组装起来马上推向市场,原来节奏可能还要一年左右,现在整体节奏都加快了。

投中网:那会有一个大模型的时间推进表么?

戴文渊:选择当下和媒体沟通,也并不是因为此刻大模型的能力已经完美,而是已经推出了一个相对完整的框架,技术可以在这个基础上不断迭代,比如说更强的思维链能力不断加强。

更想做生产力平台

投中网:所以,第四范式所想的市场和所要解决的问题到底是什么?

戴文渊:本质上讲,我们确实看到过去的软件行业在GPT或者AIGC时代可以被改变。

举例来说,如果你想打印word文件,我们之间的交互是我直接说我要打印,你就可以非常丝滑地帮我打印好,但如果是软件就需要下达指令:打开word、点开文件、选择A4、黑白,之后确认打印。

随着生成式AI能力不断提高,绝大多数菜单类的软件都可以根本性地提高用户体验,同时开发成本大幅下降。毕竟之前软件B端企业软件基于菜单式的开发,每次一个功能升级,又要周而复始的经历原型图、设计、开发等,至少是月级别的开发时间。

但由于新的“对话框”式的固定界面,现在功能和逻辑只需在数据、API和内容层面下功夫即可,变成了天级别的开发效率。

投中网:所以我理解你的意思,并不太在乎GPT所呈现给C端的效果,反而更在意ChatGPT和Office叠加之后带来的软件层面的改变?

戴文渊:从我的视角看,无论中美,并不缺任何一个基于GPT的聊天平台,如果有,很好很开心,如果没有,也无所谓。

但生产力的平台是决不能错过的,如果别人以天为单位开发软件,你以月为单位开发软件,肯定是难以接受的。真正从社会价值角度看,我们就该把重心放在将GPT当做一个生产力的平台,用这样的角度来看其推动产业界的进步和变化。

投中网:你也因此把第四范式大模型定位在此,一个生产力的平台?

戴文渊:我们的定位是改造软件,用生成式AI来重构企业软件。

对于企业来说,其目前有海量的软件正在使用,但即便Office软件在面对海量用户水平的参差不齐时上手都有难度,2B的软件门槛只会更高。我和一个合作伙伴聊天时,他给我们展示所使用的软件,下拉菜单甚至已经超过了屏幕的大小。

从某种角度看,B端软件相比如C端在体验方面改造空间更大,是最有可能先被大模型改造的。

投中网:这可以解决之前AI公司落地难的难题么?

戴文渊:很早之前我就明白,AI公司更多还是需要生态的合作。比如之前用AI改造一个供应链场景,我们的工作两周就搞定了,但整个智慧供应链却因为软件的开发周期需要做一年。这确实影响了整体AI的推广速度,因为系统不做完就没办法真正推广到用户中去。

但现在,生成式AI改变了这样的局面,使得可以实现多方多赢。毫无疑问,当下AI公司迭代的周期大大缩短,业务拓展的速度也加快了。

投中网:所以这是此前一波AI和当下这波AI所最不一样的地方?

戴文渊:当生成式AI出来之后,最大的不同是有可能实现端到端的改变。原来AI对于软件和产业改造依然是整个系统里面决策的部分,现在变成了整个系统都可以被改变。

之前的AI可以把历史上的数据都收集到一起,用机器学习,总结出各种规律,提高了做决策的水平,现在,生成式AI在这个基础上,可以直接在极短的时间内生成一整个可以落地的应用。

一定会诞生一批巨头公司

投中网:所以国内大模型的发展和竞争生态会演变成什么?

戴文渊:我只能说先入局者确实会有飞轮效应。仍以软件为例,当软件的飞轮转动起来,你在局部就已经建立了非常强的优势,甚至都不需要将其迭代到一定的水准,都一定会比传统的软件形式更强。

投中网:所以某种程度上,有人说,现在很多人都已经在同一起跑线上了,你并不赞同这样的观点?

戴文渊:我很难称这个为同一起跑线,虽然大家都在大模型领域竞争,但这正如当年互联网时代众多巨头初具规模,而互联网的机会依然宽广一样。举个例子,前段时间朋友闲聊,他就准备用生成式AI做一家猎头公司,我觉得这样反而可能会成为一家猎头业的大公司。

很多行业在这一波里面可能都会有很多新的机会。

投中网:那么,在整体国内大模型的对比坐标系里面,你怎么看待自身的位置?

戴文渊:其实我们并不需要完整地对标OpenAI,也并不需要OpenAI能做什么自己就一定要做什么,比如第四范式的大模型背后也有画画的能力,但在画画能力上超越OpenAI并不是我们想关注的。

我们更想着重发展自己思考下所需要的能力。比如我把自己的大模型定位在新型开发平台,能重构企业软件,就需要着重加强知识库和思维链的能力。

我们一直在做AI相关的事情,一个软件里面做决策的类别就是我们做的,但除了决策之外的部分,所以我们经常会想到另外的部分是否可以用AI把周期缩短,而等GPT来了之后,我们找到了这个确定的答案。

所以此时此刻,非要说我们和其他大模型公司的区别,那就是在当前并不清晰的大模型浪潮中,我们不去参与一场全面的竞争,而是专注于这其中一场比赛。

投中网:那很多人说制约大模型最难的是基础设施,数据、算力、人才等,这些你怎么看?

戴文渊:最重要的因素按照顺序排列,分别是数据、算力、人才。

大模型的数据分两个层面,一个是通用大模型的数据,一个是一些细分领域的数据。前者没有特别大的壁垒,但门槛也不低,因为并不是随便一个团队都能把这些收集到一起,也不是收集完之后就完全可以用了;后者更大程度上需要特定的“领域”的概念,因为这部分的数据就是这个领域的壁垒所在。

当下真正商业有用的思维链(多步推理)能力,并不是考验大象放冰箱分几步,这只是智力水平的考验,而是基于这样能力的思维链基础,在学习大量企业软件的数据和“攻略”后,能形成中间的逻辑推理步骤,从而做到AI拆分、执行复杂的工作。

算力的门槛现在确实是被拉高了,所以入局的门槛变高了。但是在达到这个门槛之后,重点在于如何选择方向。

投中网:在这样一个接下来大模型无处不在的时代,中国企业有哪些独特优势?

戴文渊:中国人是只要有机会就一定会积极向上的,所以这次大家看到了这么多机会,就一定有人上去做出各种各样的事情出来。

我们可能看问题的角度要转变下,我们并不需要看中国有多少个能做成GPT的OpenAI,在未来生成式AI能大幅降低成本的情况下,一定是有独属于生成式AI或者AIGC技术结合产业的广阔市场,会诞生出很多巨头公司出来。


投中网《智识》栏目:用镜头对话一线投资人和创业者,捕捉先行者的思考维度,记录亲历者的一线感知,共享他们对芯片、新能源、机器人、企业服务、自动驾驶、人工智能等细分赛道的真知卓识。

网站编辑: 郭靖
本文为投中网原创文章,转载或内容合作请点击转载说明,违规转载法律必究

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK