7

专访Meta CTO:AI已是XR杀手应用,LLM开源社区竞争没有输家

 8 months ago
source link: https://www.aixinzhijie.com/article/6841976
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

来源:新智元

FuIALEAMQmjUN6fmrmkZfw0lmLBj.jpg

图片来源:由无界 AI生成

Meta CTO接受访谈,大谈AI开源竞争,认为AI开源将让所有参与者获益。同时,XR已经准备好利用AI搭建杀手应用,Meta最近推出的AR眼镜就是最好的例子。

最近,Meta CTO Andrew Bosworths公开接受了记者的专访。

他针对Meta如何将AI和XR行业融合在一起,以及Meta对于开源AI社区的竞争和发展,AI人才的流动聊了很多。

FiH4jk_5sdyzLeYZm5Aqxkz13HTu

当XR遇上AI,如何迸发出火花

问题:看起来,当混合现实硬件与生成式人工智能相结合时,会得到1+1大于2的效果吗?

在7年前Michael Abrash的Connect演讲中,他探讨了大型AR的未来愿景,强调人工智能是核心组成部分。

但之前的认识可能存在误区,认为需要大量狭窄的数据集才能获得更好的AI系统。然而,这种思维方式正逐渐转变。

眼镜类产品在市场上的长期存在,加上人工智能的应用,就可以显著提高眼镜的实用性。

在大型语言模型出现之前,机器学习总是围绕着创造价值的应用发展的。

FiFiaEfhkdKBUHfBboEg7jMyfHS-

例如,Facebook在引入News Feed排名机制之前已存在,但随着时间的推移,其排名机制得到了改善。

类似地,所有人工智能系统通常都是基于非AI元素开始,以获取数据集,随后这些数据集支持人工智能系统的不断进步。

然而大型语言模型与以往不同,它已经具有了很强的通用性。这意味着不再需要精确或完美的训练数据,现有的人工智能技术将成为未来Meta设备的基石。

Meta最近刚刚和Ray Ban合作推出的眼镜就是一个例子。这款眼镜具有摄像头视频、实时流媒体、优质音乐播放和通话的功能,是一款优秀的产品。

刚刚推出时,我们觉得需要一个「智能助手」来帮助用户使用这些功能,但是6个月过后,智能助手本身成为了眼镜上最为流行的功能了。

他强调,硬件产品的关键功能在短时间内发生改变是非常罕见的,但在眼镜的案例中却发生了,显示了技术发展的迅速和不可预测性。

问:您认为人工智能将如何在Quest中发挥作用?

在Quest上,我们真正想要实现的一些功能实际上并没有很好的训练数据集。

文本,我们有整个互联网作为资源。照片,Facebook和Instagram上有庞大的图库。但对于3D对象,尤其是在四维空间中动画的3D对象,却没有一个大型、权威的数据库。

这正是我们真正想要的。我们正在努力,试图改进这个模态下的一切内容,包括能够导出更多的3D内容。

所以混合现实和虚拟现实非常难以实现,因为你要实现的是一个额外的维度空间上的所有内容。

但另一方面,XR和VR显然有巨大的优势,它们有始终开启的传感器。这些传感器始终在扫描和感知空间。

Meta依然在进行研究,在3D和4D空间上看到了一些很有潜力的事情。

Fp5hDZO4oxbOF_txKHSZb1QZsgyQ

问:您想要实现的杀手级用例是什么?

答:在短期内,公司重点关注的是创作者,提供了设计头像、创建世界和游戏等功能。

而Meta的长期目标是提高用户与机器的交互效率,使用户能够同时在内容和系统层面进行交互。

例如,用户可以直接通过简单指令来启动游戏并邀请朋友参与某个游戏。

这可能是一个非常复杂的过程,需要在系统中启动游戏,同时向好友发出邀请,并将他们拉到同一个应用中的同一个地方。

开源AI,Meta与社区共荣

问:请问Meta开源Llama背后的策略是什么?

公司自2006年以来一直是开源领域的领导者。他们利用了多个开源项目,如PHP、Memcached和MySQL,这些项目帮助公司以较少的员工高效运作。他们还推动了PyTorch项目,这是一种主要的机器学习工程系统,并对其进行了开源。

FiyWytYnNskn_KvBT7v5ZTwhqc2I

开源项目的一个重要好处是围绕它可以建立起一个社区,这使得项目自我强化。例如,使用PyTorch的行业其他成员构建的工具也为公司所用。公司也观察到了他们的Llama项目的成功,这个项目有着庞大的建设者社区和1亿次下载记录,已经促成了多个不同项目和商业程序的成功。

公司还强调了开源软件的价值。他们的研究实验室发现,开源软件可以迅速获得独立第三方的验证结果,促进进一步的发展。虽然不是所有东西都适合开源——例如,由于数据集的使用或安全考虑——但在可能的情况下,他们倾向于开源,因为这对所有人,包括他们自己,都是双赢的情况。

Foa5b9mbRswpEM9UhFrZ9qQicMsX

问:来聊聊Llama,您的人工智能模型家族。开源Llama背后的策略是什么?

答:从我2006年加入Facebook那天起,Facebook一直以来就是开源领域的领导者。

PHP是开源的。如果Facebook没有接手Memcached这个项目,我们就会倒下。

MySQL是开源的。这就是Facebook之后能够成为一家规模小但是效率超高的公司,并以少量员工完成如此多工作的原因之一。

Meta现在不仅在推动这些项目,而且还在推动PyTorch,这是完成机器学习工程的第一系统。我们构建并开源了它。

开源项目的一个重要好处是围绕它可以建立起一个社区,Meta可以充分利用这个社区中的一切资源。

例如,使用PyTorch的其他成员构建的工具也为Meta自己所用。

就Llama而言,很多人都从中受益了。已经达到了1亿次下载,我们已经看到了由此产生的各种不同项目,并且有很多商业程序正在Llama基础上取得了成功。

FhOcHWVOk06Bf7UKE90o5YeR77jc

如果Llama继续保持如今的发展势头——成为大型开发者社区的绝对核心——Meta也将受益匪浅,这对Meta的帮助也会非常大。

另外,如果再看看成立刚好10年的FAIR,我们研究实验室 一直以来也都秉承开源的理念。当开源软件时,FAIR会立即获得独立的第三方验证结果,然后有人在此基础上继续发展。

Fv7wRwGq9ovU1UmUBZ6qEOaC9tcH

我们可以使用该结果来构建我们的下一篇论文,或者是开发我们的下一个程序。

我们不可能开源一切。比如我们的某些研究,因为其中使用的数据集,或者因为它的安全性,没有办法开源它。

但在其他条件相同的情况下,我们确实尝试开源,并相信它将帮助包括我们在内的所有人。这是双赢的。

问题:开源战略对招聘有何影响?我知道有些工程师喜欢开源,而有些人工智能研究人员认为开源如此强大的技术是不负责任的。

答:我认为这肯定有助于我们拥有更大的招募规模,因为更多的人熟悉您的模型以及训练模型的方式。我们可以雇佣更多懂得如何使用PyTorch的工程师。

因此,我认为这对于从越来越多的人中进行招聘来说确实很有好处,这些人距离在公司取得出色的成绩只有一步之遥。

关于认为「开源是不负责任」的说法,我认为对这些大型语言模型的很多焦虑都是错误的。

我觉得Yann LeCun说得很好。开源模型是一个超级有趣且重要的工具。我认为它是一个关联数据库。

Fv8tvFXYvZgxBQn671KuTzhRoX8v

没有推理或计划的能力,没法理解世界。而且现在来看未来也不会拥有这些能力。

技术依然会不断取得突破。这是一个非常激动人心的时刻。这是一项伟大而重要的技术。

我迫不及待地希望它的构建成本、运行成本、延迟更低、效率更高,能够在低功耗、小型设备上运行真正强大的模型。这些都是非常重要的事情。但是会花费大量的时间和精力。

而且,大模型也不是AGI。大模型发展到极限本身不会达到AGI。冯·诺依曼关于奥本海默的那句话怎么说来着?

「有时有人为了获得功劳,不惜承认自己有罪。」我认为硅谷有时会发生很多这样的事情。

我并不是说人们不相信它。也许有的人会相信,但是我不会。

AI人才迎来黄金时代

问:你们在招募下一位杰出的人工智能研究人员时的宣传口号是什么?如何让他们加入 Meta,而不是OpenAI或Google DeepMind?

A:研究人员现在有很多选择。现在是入行的好时机。这些公司差异很大。如果有人想加入 Google,成为他们千人团队一员。

但是在Meta有不同规模的团队,每个人能获得的个人影响力是完全不同的。OpenAI 是第三个不同的机构。他们有非常不寻常的治理结构,股权单位似乎也不太一样。

FknmygZHX4jyoe4w4mr9d86DRVu3

问:那么招聘工作还顺利吗?

答:进展顺利。确实有很多伟大的人才正在离开刚刚说到的3家公司。其中一些人才将流向该另外几家公司。

其中一些人才也将去往全新的地方,法国的Mistral是一群开发Llama的人才构成的。

按照硅谷的标准,我的职业生涯已经很长了,也就见怪不怪了。

当新技术出现时,人们的热情就会大爆发。其中一些人才流向初创公司,一些流向老牌公司。但是一定会有更多的人才进入这个行业。

现在就是这样一个时代,人才的总数在不断增加。深度学习研究人员可能比一年前多了10倍。因为人们看到这样的需求,所以就有越来越多的人开始学习和研究这些技术了。

问:你提到了Mistral。上周推出的Mixtral模型使用了专家的混合体,这似乎与你们在 Meta 所做的事情形成了竞争。你是这样看的吗?

Fg1WMBzmx_NHzeKOIfVOM8ONiDFP

答:不。如果整个社区团结在任何开源模型周围,并且它成为事实上的标准,这就是发生的有趣的事情之一。

我们可以使用这个模型。它不一定来自我们,就像Memcached不一定来自我们一样。

MySQL不是来自我们。这些都是伟大的事情。我们很高兴使用它们。因此,一旦你不想与开源竞争,开源就是好的。

让我们拥有相互竞争、采用不同策略并尝试在不同方面超越彼此的模型。「

我的商业模式不会阻止其他人使用这项技术。」

需要明确的是,Llama 团队绝对希望击败所有其他模型。这种竞争是很好的,很健康。

这是人们之间出于善意和良好精神的竞争,而不是为了生存下来的竞争。

如果你输掉了这场比赛,你的惩罚就是你可以使用更好的模型。

参考资料:

  • https://www.semafor.com/article/12/20/2023/meta-cto-andrew-bosworth-on-the-generative-ai-craze

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK