2

独家丨王小川投身大模型,思路是什么?他会怎么做?

 1 year ago
source link: https://www.geekpark.net/news/317340
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client
综合报道
12min read

独家丨王小川投身大模型,思路是什么?他会怎么做?

2023/04/10
7276897af4f5d8e6c3d0e86441f2a54d.jpg

王小川说,自己不想做中国的 OpenAI,而是世界的百川智能。

「今天距离 ChatGPT 发布,已经第 131 天了。」

身着橙色帽衫,王小川走进一间近 30 平米的会议室,在这里,他宣布了自己即将投入创业的大模型产品名叫「百川智能」。「川」字一语双关,既象征了河流汇聚入海的过程,如同数据汇聚产生支持;又隐含了自己的名字,「我把自己也放进去了。同时也意味着需要更多人才加入进来。」

这场内部交流会可谓低调,现场没有 PPT,王小川对着一台 iPad 讲述完自己的创业背景与愿景,过程中楼上不时传来一阵阵装修的电钻声。这是在搜狐网络大厦的二层,戏剧性的是,不久前亦投入大模型创业的王慧文所创立的光年之外也在这栋大楼办公。

而本次创业的启动资金也同样低调——「百川智能」由 5000 万美金启动,据王小川本人介绍,资金部分来源为他个人出资,其余为几位友人的个人支持。相比光年之外的两亿美金融资(未宣布 close),在大模型领域,五千万美金并不是一笔引人瞩目的金额。但王小川表示,将产品从 0 到 1 跑通,这笔钱在初期够用了。

但据极客公园了解,王小川完全可以拿到更大金额的融资,他却选择了相对较小的初步启动资金。在大模型领域大消息不断的 3 月,外界环境的变化令他逐渐从冲动过渡到冷静,选择了以极低调的身姿入场,为的是「不让早期团队有太大压力」。

事实上,早在一个月前王慧文高调入局后,王小川就开始了与产学界和政府有关部门的密切交流。最近他在社交平台上发布了不少言论,称如果机器掌握了语言,则强人工智能的时代就要到来。在此次交流会上,王小川强调,创业搜狗的背景是他带领团队做大模型的最大优势。「搜索就是做语言,在 AGI 方向,做语言是很大的优势。」而据极客公园观察,这一个月以来,王小川也是大模型创业者中,最被业内看好的一个。

在「百川智能」目前公布的图景中,目标是「要构建中国最好的大模型底座」——「最好」体现在参数、品测以及体验。与别家大模型有所区别的是,「百川智能」将率先在教育、医疗两个垂类领域做知识增强,目标是要帮助大众获得普惠知识,帮助企业做通用服务。底座产品目标在年底公布,垂类产品可能会提前公布。

人才是大模型领域竞争的关键词。王小川透露,「百川智能」到月底团队会接近 50 人,不到一半是搜狗班底。而半个月后他本人就要飞去美国继续招募技术人才。

有趣的是,这场交流会的灵感来自 ChatGPT,当王小川问及 ChatGPT:如何招到更多更好的大模型领域人才?ChatGPT 给出的回答是,你要先对外界讲清楚你的逻辑。于是才有了这场交流会。

有关此次创业的融资节奏,王小川的表现和外界的狂热期待并不相符,当被极客公园问及这是否仍是职业经理人作风,而非创业者身位——他笑着回答,「我习惯了一切 ready 才公布,我承认这有职业经理人的惯性思维,但我走出来了,所以先选择向大家公布。」

01 从狂热,到冷静

王小川低a调官宣的背后,是过去数月大模型创业从狂热到冷静的一个缩影。

说起王小川,第一个浮现出的标签往往是「理工天才」,他有着世人对「理工男」刻板印象里的那些特质:做事审慎,不想好不出手。但在大模型这件事情上,王小川最初也曾陷入狂热之中。

就在王慧文在朋友圈宣布做中国版 OpenAI 的前一天,创业者社区「前沿社」举行了一场关于通用大模型的线上交流会。「OpenAI 正在展现出一场革命的开篇,这将是是互联网和移动互联网之后,同等量级的产业变革。」会上,极客公园创始人张鹏提出这个观点,并在与会者中发起投票。

一共 13 票投向认同,这里面第一个投票的就是王小川。参与活动多次以来,那一晚是他一年多来表达最多,也最兴奋的一次。

在这场交流活动上,王小川是 ChatGPT 最坚定的支持者之一。当几位参加交流的 AI 领域创业者,尝试仅仅从功能上定义 ChatGPT 的进步的时候,王小川甚至明确表态,说大家「把这件事想小了」。

「我看到了 AGI(通用人工智能)的曙光!」王小川说这是他去年末开始体验 ChatGPT 的时候,内心最强烈的感觉。并且在这次讨论活动里,第一次含蓄透露了自己可能也会参与大模型这场变革的态度。

在 2023 年 2 月 12 日极客公园前沿社的一次「AGI 信徒聚会」上,王小川第一次明确表达了「早就下决心肯定要入局」的决心。或者说,王慧文的突然高调入场,实际上打乱了王小川原本四平八稳的节奏,某种程度上帮他走出了「经理人的思维」,开始激活了「肾上腺素」。

16c226f217b2a5ec5b7563811c71cb97.jpeg

左起:李志飞、周源、王小川、翟光龙、张鹏

极客公园从接近王小川的人士处得知,在王慧文高调宣布入局后一周左右的时间内,王小川也曾准备对外宣布入局。但那段时间密集的舆论热潮,外界不上船就要被落下的 FOMO 心态,让他最终开始刹车反思自己急匆匆宣布,是否真的有必要。

1a841aced05b1ada6edcf76c1388b073.jpeg

王小川最熟悉的「老地方」

王小川沉默的这段时间,其他先放出消息的团队开始了紧锣密鼓的筹备工作。王慧文设立北京光年之外科技有限公司,吸引了顶级 VC 上亿美元的认购。

另一位宣布投身大模型领域的出门问问的创始人李志飞,曾向极客公园表达过他的观点,他认为,通用 AI 大模型就像是核武器,入局确实有时间窗口。「人才壁垒、时间壁垒、数据壁垒、资金壁垒一旦建立起来,小的团队就没有戏了。」王小川和李志飞也是很熟悉的朋友,他也认同这个观点,但是他也提出了一个观点——「这事情不能上头,还是要走心多思考下。」

在过去一段时间中,确实有些东西是值得思考的。比如以最早宣布入局的王慧文为例,一个月过去了,即使手握大笔资金,招到足够人才,特别是一个业界被认可的首席科学家或者 CTO,依旧是充满挑战的任务。

而从收购 AI 架构公司一流科技 Oneflow,到意向收购两家清华 NLP 团队的初创公司——深言科技和面壁智能。也体现了王慧文希望尽快用最短路径集结人才,而这恰恰体现了大模型创业的复杂性,资本意义重大,但不是唯一决定性的因素。

而王小川在 AI 领域的积累和在技术产品领域的个人品牌和经验,确实让他在思考后,可以选择另一种入局的方式。

02 融资思路为何变化?

值得关注的第一个不同的思路,就是王小川为何把启动资金设在 5000 万美元。

在 ChatGPT 问世的时候,王小川曾经发过一条朋友圈说:OpenAI 的胜利,是技术理想主义的胜利。

从创立公司到推出 ChatGPT,OpenAI 整整走过了八年,在那之前,他们投入了大量的资金和资源。但也正是这种对技术的信仰,才能让他们取得震惊世界的成就,在 AGI 的前夜,为自己赚取今天难望其项背的领先优势。

最初国内创业者都是想做中国的 OpenAI,也就是做底层的通用大模型,这件事背后的逻辑很简单:

  1. OpenAI 不能进入中国,国内一定需要自己的大模型。
  2. 互联网大厂会做大模型,但他们吃不下所有市场。有业务重合的公司不会把命脉交给大厂,所以创业团队就有生存的空间。
  3. OpenAI 已经踏出了一条成功的路径,如果哥伦布已经发现了新大陆,你在这个方向上,就有可能用更短的时间和更少的资源在国内做出同样的事情。

几个月过去,今天来看前两者都没有问题。但复制OpenAI的路径,却看起来越来越有挑战。

  • 3 年前发布的 GPT-3,还只是一个基础的底座;
  • 半年前的 AI 机器人 ChatGPT(GPT-3.5),已经是一个完整的产品,并具备了泛用场景下对话这个更高阶的技术能力;
  • 一个月前的 GPT-4,则具备了更强的推理能力和多模态转化能力;
  • 几周前,OpenAI 宣布支持 ChatGPT 插件,后者已经不只是一个产品,而是一个生态,甚至是操作系统。

以大模型能力为基础,OpenAI 已经构建起产品能力、商业化能力和生态能力,这为他们积累了大量用户,而数据飞轮效应进一步加快 OpenAI 迭代基础大模型。

如果说做一个大模型的难度系数是 1,想要快速做出能对标 ChatGPT 水平的、「完全开放式对话产品」的难度是 100 了。

既便王小川决心要做中国的 OpenAI,甚至最终要超越他。那么他核心要面对的问题就是:

  1. 你要做哪一年的 OpenAI?2015 年的?2020 年的?2023 年的?还是 2025 年的?每一年 OpenAI 的能力体系都是不一样的,新的创业者如何建立自己的特点、差异化和优势呢?
  2. 从追赶到超越,一个创业公司的万里长征第一步要怎么走?第一个里程碑设立到哪里?第一个能闭环的商业循环是什么?

当面对 OpenAI 在过去数年烧掉数十亿美元构建起的完整生态,复制相同的路径需要的资源,不论是 5000 万美元还是几亿美元,如果不考虑造势问题,其实都是杯水车薪。

比较务实的思考是如何迅速启动,设定合理的里程碑,并且用最高的效率,以及超预期的结果到达里程碑,那么后续的资源才会源源不断。

据参与了王小川本轮融资的好友透露,王小川正是出于这个考虑,改变了之前设定的融资计划。在内部交流会上,王小川被问及五千万美金是否经过详细的计算,他透露,「从 0 到 1,5000 万的启动资金就够了。但要持续做到最好,我估计应该是从 3 亿-20 亿美元之间。」

03 王小川想要怎么做?

交流会上,王小川给出了百川智能现阶段的几个目标:

  1. 构建中国最好的大模型底座。
  2. 在几个方向加强:搜索的增强,多模态的增强,教育、医疗等知识层面的增强。

相比 OpenAI 专注在一个通用模型,百川智能则会同时发展垂类模型和通用模型。

对于通用大模型,王小川称,百川智能目前已经开始训练 500 亿参数的模型,进展很顺利,年底前预计会发布对标 GPT-3.5 的大模型,有信心今年年底做到国内最好。

相比之下,垂类模型预计会出来的更快。尽管垂类模型的通用性没法与 OpenAI 抗衡,但可以通过针对具体场景优化,在细分场景里达到与 OpenAI 相近的效果,从而积累用户、构建起生态,跑通小闭环。

而王小川选择的几个场景,除了搜索这个老本行外,选择医疗、教育这两个垂类赛道,是因为这两个行业「对知识的要求最高」,而这个特征也会是大模型最先落地的方向。

甚至王小川曾经与参与本次投资的朋友表示,大模型的之外,最需要花精力的,是打造超级应用的思考和实践,「最大最成功的公司一定是在应用上想得最清楚的公司。」

显然,中国 OpenAI 这件事,今天已经不只是大模型本身的竞争,而是大模型、超级 App、行业应用三合一的「新铁人三项」赛了。

附:王小川公开信全文

今天我正式宣布,创建「百川智能」,一家研发并提供通用人工智能服务的中国公司。

生活在二十一世纪初是如此幸运,波澜壮阔的互联网革命还没有谢幕,通用人工智能时代又呼啸而来。多年前我曾断言,机器掌握语言,通用人工智能时代就来了;我也有畅想,搜索的未来是问答。ChatGPT 的腾空出世,地动山摇,这一切都开始成为现实。ChatGPT 发布到今天,仅仅 131 天,每天都有扑面而来的新进展、新突破。131 天恍如隔世!

大半个世纪以来,科学家们前赴后继,努力创造通用智能机器。这一天终于到来,我们找到了一条巧妙的路径,用 AI 成功将语言转化成了数学模型。语言是知识、思考、沟通和文化的载体。维特根斯坦说,语言的边界就是世界的边界。当 AI 掌握了语言后,就开始认知世界,成为有知识、能思考、善表达、会学习的智能体。我把这样的智能体称为「语言 AI」。

人类个体总有消亡的一天,但能够将毕生的知识通过语言记录下来供新生命学习、继承,文明因此延续。人类协作也需要个体之间通过语言沟通。掌握了沟通和世界知识的语言 AI 不再只是人类的「工具」,而将成为我们的伙伴和超级助理,成为人类文明的一部分。

智能时代会改写互联网时代的范式。『连接』会被『陪伴』取代,『信息服务』会被『知识服务』取代,『免费与广告』会被『付费与高品质』取代。

智能时代也会改写自工业时代以来的范式。曾经是专业化社会分工带来规模效应与效率提升,而未来会是逆专业化分工:之前需要很多公司协作完成的工作,会因为 AI 的赋能『端到端』的完成。

智能时代将再一次开启「文艺复兴」。每个人都会因为 AI 的助力而变得更加强大。用好 AI,一个人就可能做一个公司,解决之前难以解决的难题,也更容易成为自己想成为的人。社会也会更加扁平,以前少数人才能享有的智力服务,也能更普惠。

告别搜狗后,我已开启新的远征:立志往后二十年,为生命科学和医学的发展尽一份力,为大众健康做出一点贡献,核心路径是构建生命健康数学模型,并已经付诸行动。ChatGPT 的出现,也将成为新远征的重要助力。

不仅如此,ChatGPT 是我过往经历的延续和升华。2019 年我将搜狗的使命升级为「让表达和获取知识更简单」,愿景定义为「帮助每个人轻松地对话和书写。便捷地获得知识和服务,提升工作效率和生活品质」。

搜狗输入法和搜狗搜索的数据制备和产品形态,也与 ChatGPT 接近。它们都是把互联网上的全部语言数据收集、清洗,压缩成数据库并构建超级产品。随着深度学习的发展,这些产品都多次迭代升级,全面用上了 Transformer/Bert 等技术。输入法猜你想说什么,搜索猜你想要什么。而 ChatGPT 把这些能力推到了一个全新的高度,是输入法、搜索之外,第三个把全网数据转化成语言服务的超级产品。搜狗未尽的使命在机器掌握了语言后终于可以实现。

很多朋友认可我的技术理想主义和技术驱动的创业经验,鼓励和支持我做中国的 OpenAI。也有很多搜狗和非搜狗的技术大拿,得知我有做大模型的想法,主动申请参与组队,甚至「带资入组」。

我最动心的是,能和一群有理想的人,用极致的技术驱动创造出颠覆性的智能产品。这一次,百川智能将借助语言 AI 的突破,构建中国最好的大模型底座,并在搜索、多模态、教育、医疗等方面增强,帮助大众轻松、普惠的获取世界知识和专业服务。

筹建百川智能不到两个月,已有多位技术合伙人和领军人物的加入。到这个月底将会有近 50 人规模的精英团队。大模型的训练也已经启动,进展顺利。按照现在的进度,争取年内发布国内最好的大模型和颠覆性的产品。

我们是中国公司,但我们并不希望只是「中国的 OpenAI」,而是能建立世界级的视野和技术品质,让中国享有世界级的产品,产生有世界影响力的技术的突破,进而服务海外。百川本意是众多的河流汇集奔赴海洋,象征着众多数据、行业知识汇聚成为一个强大的智能体系,生生不息。百川也象征着集百家智慧,更多人与我一道共赴山海。我们呼唤中国的领军人物、行业产品经理和远在美国的同仁的加入。

同志们,请通过如下邮箱联系我们:

[email protected]

[email protected]

[email protected]

[email protected]

[email protected]

通用人工智能时代刚刚开启,我们作为第一批跨入新时代的人类,带着焦虑和好奇去拥抱它,思考和探索「我是谁?」我们还可以把自己的智慧注入它,做新时代的开创者,让后代们有一个更美好的未来,繁荣和延续人类文明。

百川智能 CEO 王小川

2023 年 4 月 10 日


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK