5

孤注一掷:微软CEO纳德拉“All in”人工智能

 1 year ago
source link: https://www.36kr.com/p/2303765057564162
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

孤注一掷:微软CEO纳德拉“All in”人工智能

神译局·2023-06-16 03:25
这位首席执行官无法想象没有人工智能的生活——即便那是人类发明的最后一样东西。

神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。

编者按:在 PC 时代,微软是当之无愧的巨头。但鲍尔默的保守,差点让巨头过气。在萨蒂亚·纳德拉接管之后,他用“移动优先和云优先”的策略让微软重新焕发了活力。而他几年前对 OpenAI 投下的重注,又让微软站在了新一波人工智能浪潮的前头。现在,他开始让公司的所有产品都围绕着人工智能转,年近 50 的微软会迎来更大的辉煌吗?文章来自编译。

quality,q_90

我从没想过我会写下这些话,但我还是写了。萨蒂亚·纳德拉 (Satya Nadella) 和他经营的公司微软正因旗下搜索引擎的火爆而兴高采烈。这与我在 2009 年第一次与纳德拉交谈时形成了鲜明对比。那时候,他还不是很出名,他还特意告诉我他的出身。他出生在印度的海得拉巴,在美国读的研究生,并于 1992 年加入微软,那时候微软刚刚开始崛起。纳德拉在公司的很多部门都呆过,在公司进入低谷时仍坚持留下来——包括微软经历了史诗般的反垄断法庭大战之后,以及微软错过了智能手机革命的时候。在介绍完他的简历之后,他才提到了自己当时的项目:Bing,一个备受嘲笑的搜索引擎,是谷歌那款占据霸主地位的产品的一位可怜的表亲,如果能攀上亲戚关系的话。

众所周知,Bing 并没有让谷歌对搜索的控制出现松动,但纳德拉的命运却从此青云直上。2011 年,他领导了新兴的云平台 Azure,搭建了该平台的基础架构与服务。然后,鉴于他的业绩履历、低调高效的领导以及比尔·盖茨的赞许,2014 年他当上了微软的首席执行官。纳德拉立即开始变革公司的文化和业务。他开放了 .net 等产品的源代码,与昔日的宿敌结成亦敌亦友的关系(与 Salesforce 合作),并展开了一系列大收购,包括 Mojang(Minecraft 的制造商)、LinkedIn 与 GitHub——都是些忠实成员,它们可能会被拉进微软世界的网络。他对 Azure 加倍下注,后者成长为亚马逊 AWS 云服务的真正竞争对手。而微软也老树逢春,壮大成一家价值 2 万亿美元的公司。

尽管如此,该公司似乎一直都没有完全重现过 1990 年代的活力。直到现在。当初创企业 OpenAI 开始开发现在让人瞠目结舌的生成式人工智能产品时,纳德拉很快意识到跟这家公司及其首席执行官 Sam Altman 合作会让微软站在新的人工智能热潮的中心。(OpenAI 愿意牵手是因为对微软 Azure 服务器的计算能力充满渴求。)

作为合作关系的首批举措之一,微软发布了 Copilot ,这给开发者世界留下了深刻印象。作为人工智能总管,Copilot 自动执行某些编码元素给开发者帮了大忙。今年 2 月,纳德拉通过名为 Sydney 的聊天机器人将 OpenAI 最先进的大型语言模型集成到 Bing 之中,此举震惊了更广大的世界(及其竞争对手谷歌)。有数百万人使用过它。是,是有些小问题——纽约时报记者 Kevin Roose 骗到了 Sydney,让后者承认自己爱上了他,并打算把他从他的妻子身边偷走——但总体而言,该公司正在崛起为人工智能领域的重量级人物。微软现在正在将生成人工智能,也就是“副驾”(copilot),整合到它的许多产品之中。它对 OpenAI 超过 100 亿美元的投资看起来像是本世纪的一笔划算买卖。(这并不是说微软对科技行业最近的紧缩趋势免疫——纳德拉今年已经解雇了 10000 名员工。)

现年 55 岁的纳德拉终于赢得了声誉,证明了他不只是微软那庞大资源的熟练的照看者以及精明的撬动者。长期以来,他深思熟虑的领导风格,引人注目的谦逊与冷酷粗暴的前任比尔·盖茨和史蒂夫·鲍尔默形成了鲜明对比。 (诚然,那些家伙设定的同理心的门槛很低。)他对人工智能迅速广泛的采用,表现出了一种大胆的态度,让人想到微软早期的活力。而现在,每个人都想听一下他对人工智能这个本世纪科技最热门的话题有什么看法。

Q:你是什么时候意识到人工智能在这个阶段的变革性是如此之大的?

A:当我们从 GPT 2.5 升级到 GPT 3 的时候,我们目睹了那些涌现能力。它开始展现出尺度效应(scaling effects)。我们训练它的时候并不是指针对编码,但它确实很擅长编码。那一刻我变成了它的信徒。我想,“哇,确实可以啊。”

有没有那么灵光一现的一刻让你决定把全部筹码都押上?

正是这种编码的能力促使我们做出了 Copilot。不过我第一次看到现在所谓的 GPT-4 那个东西是在 2022 年夏天,那次的经历令人兴奋。我一直都会拿一个查询作为参考。机器翻译出现已经有很长一段时间了,尽管已经达到了很多很好的基准,但机器翻译并不能捕捉到诗歌蕴含的那些微妙的深层含义。在印度海得拉巴长大的我,一直都梦想能够读到波斯的诗歌——尤其是鲁米的作品,但之前都是先翻译成乌尔都语,然后再翻译成英语的。 而GPT-4可以一次性地把它翻译成英语。它不仅仅是机器翻译,而是能跨越两种语言边界,维护诗歌主权的东西。这很酷。

几十年来,微软一直对人工智能进行投资——你们没有自己的大型语言模型吗?为什么还需要 OpenAI 的?

我们也有自己的一系列东西,包括一个叫做 Turing 的模型, Bing、Azure以及你使用的微软应用都有这个东西的支持。但我感觉 OpenAI 追求的东西跟我们是一样的。所以,我没有想着要训练五个不同的基础模型,我想要一个基础模型,让它成为平台效应的基础。所以我们双方决定携手合作。他们把注押在我们身上,我们也把注押在他们身上。他们做基础模型,我们围绕着基础模型做很多工作,包括围绕着负责任的人工智能以及人工智能安全开发相关工具。归根结底,我们是两家展开深度合作的独立公司,在遵守规矩的情况下追求同一个目标,而不是多支团队拼凑在一起随便做点什么。我们说,“让我们继续努力,打造一款真正能吸引全球想象力的东西。”

你有没有试过收购 OpenAI?

我是在微软成长起来的,期间试过很多有趣的方式与合作伙伴打交道。过去,我们通过与 SAP 深入合作来开发 SQL Server。所以这样的事情对我来说并不陌生。不同之处在于 OpenAI 有一个有趣的结构;它是一家非营利组织。

这种身份往往像是交易杀手,但你跟 OpenAI 设法想出了一个复杂的解决方法。

他们建立了一个营利性实体,我们说,“我们没意见。”我们有良好的商业伙伴关系。我觉得双方会达成长期稳定的交易。

显然,这种设置是为了让 OpenAI 能从交易赚钱,就像微软一样,但你们的合作的累计利润是有上限的。一旦达到上限,就像灰姑娘的马车会变成南瓜一样——OpenAI 就得变回纯粹的非营利组织。那时候的合伙关系会怎样? OpenAI 会不会说:“我们完全是非营利性的,我们不想成为商业运营的一部分?”

我认为他们的博客对此已经进行了说明。不过,从根本上说,他们的长期想法是实现超级智能。如果发生这种情况,我想一切都不好说了,对吧?

是的。对所有人来说都一样。

如果这是人类最后的一项发明的话,那么一切都不好说了。对于那个东西是什么,什么时候会到那一天,不同的人会有不同的判断。没有讲到的是,政府对此有何看法?现在我暂时先不讨论这个。这只有在出现超级智能的情况下才会发生。

quality,q_90

摄影:Meron Menghistab

OpenAI 的 CEO Sam Altman 相信确实会有那么一天。你是否同意他的观点,也就是我们将达到一般人工智能(AGI)这个超级智能的基准?

我更关注的是对我们所有人的好处。工业革命直到很久以后才蔓延到跟我出生长大的地方类似的世界各地,这让我很困扰。所以我在寻找可能比工业革命更伟大的东西,像工业革命为西方做到的事情,但这次是为全世界的每个人去做。所以我对AIGI的出现或者很快会出现一点也不担心。这是在是太好了,对吧?这意味着 80 亿人的富足。生活在那样的世界里一定会很奇妙。

实现这一愿景的路线图是什么?现在,你正在将人工智能植入到你的搜索引擎、数据库以及开发者工具当中。但这些都不是得不到充分服务的人在用的东西。

好观点。我们不妨先看看开发者的边界是什么。让我真正感到兴奋的事情之一是开发的乐趣又回来了。微软一开始是家工具公司,尤其是开发工具公司。但多年来,因为软件开发的复杂性,开发者一度享有的专注度度与流畅度被破坏了。我们与这位人工智能程序员 Copilot [编写普通代码,让程序员有时间处理更具挑战性的问题] 所做的工作非常值得一看。现在,GitHub 上的 1 亿开发者可以尽情享受了。然而,随着人工智能变革了编程的过程,编程可以增长 10 倍—— 1 亿可以变成 10 亿。你给 LLM (大型语言模型)提示时,你就是在对其进行编程。

任何拥有智能手机并会说话的人都可以成为开发者吗?

绝对如此。你不必编写公式或学习语法或代数。如果你说提示就是开发的话,那么学习曲线会好很多。你现在甚至提出这个问题:“什么是开发?”开发将大众化。

至于说如何普惠 80 亿人的问题,今年 1 月我曾在印度看到了一个很棒的演示。印度政府有个叫做数字公共产品(Digital Public Goods)的计划,其中之一就是文本转语音系统。在演示中,一位农民正在用这套系统询问他在新闻上看到的一项补贴计划。系统向他介绍了计划,还告诉他可以去填申请表。一般来说,系统会告诉他从哪里获得表格。但是印度的一位开发人员已经用所有的印度政府文件对 GPT 进行了训练,因此系统会自动用不同的语言替农民填申请。几个月前在美国西海岸创造出来的东西已经被印度的一位开发者掌握,后者稍加修改,即可让印度农民通过手机上的 WhatsApp 机器人获得这项技术的好处。我的梦想是让地球 80 亿人都能拥有一位人工智能导师、一位人工智能医生、一位程序员,或许还能拥有一位顾问!

这个梦想很伟大。但生成式人工智能是一项新技术,而且有些神秘。我们真不知道这些东西的机制是怎么样的。我们仍然有偏见。有些人认为现在大规模采用还为时过早。谷歌早就做出了生成式人工智能技术,但出于谨慎,他们推进得很缓慢。然后尽管谷歌的做法有保留,你一下子就把它植入到 Bing 里面,并挑衅谷歌不敢做同样的事情。你的原话是:“我想让大家知道我们能带谷歌的节奏。”谷歌确实闻风而动,改变了战略,并拿出自己的生成式人工智能搜索产品 Bard 进入市场。我不想说这很鲁莽,但可以说你在Bing上面的大胆举措是一步先手,促使大大小小的竞争对手匆忙入局,而不管其技术是否准备好了。

从某种程度而言,我们这个行业的美妙之处在于,重要的不在于谁拥有能力,而在于谁能够真正运用这种能力,并将其转化为有形的产品。如果你想提出质疑,不妨回过头看看施乐帕洛阿尔托研究中心(Xerox PARC) 或微软研究院,你可以说那里研究出来的东西就不应该做。问题是,真正有用的,帮助世界前进的事情是谁做的?这就是我觉得我们需要做的事情。去年的时候谁能想到搜索其实可以再次变得有趣?谷歌做得非常出色,在产品和分销方面都处于领先地位。谷歌搜索是Android 的默认引擎,是 iOS 的默认引擎,是最大浏览器的默认引擎,还有很多。所以我想,“嘿,我们来创新一下,改变一下搜索范式,让谷歌那 10 个蓝色链接看起来像 Alta Vista一样吧!”

你说的那是 20 世纪 90 年代的搜索引擎,当谷歌对搜索做出了创新时,它一下子就过时了。这么对比太强烈了。

我用过 Bing Chat 之后就再也回不去了,甚至原来的 Bing 也回不去了。因为回去已经毫无意义。所以很高兴现在有了 Bard 和 Bing。让我们来一场真正的竞争,让人们享受创新。

我想你一定很高兴终于推出了一项能让大家注意到 Bing 的搜索创新。我记得你在 2009 年运营 Bing 的时候是多么沮丧;似乎你在追逐的是一个无与伦比的对手。有了人工智能之后,我们是不是已经站在其中的一个转折点了——是不是要重新洗牌了?以前地位纹丝不动的赢家是不是开始动摇了?

绝对的。从某种意义上说,每一次改变都会让我们更接近Vannevar Bush 的那篇文章中首次提出的愿景(《As We May Think》,1945 年发表在《大西洋月刊》上的一篇文章,首次提出了在计算机驱动下我们将进入信息天堂的观点)。那是个梦想,对吧?问题是,一个人如何能创造出这种成功感,你得经过一系列的跨越,从Bush到 JCR Licklider (他在 1960 年设想了“人类与计算机的共生”),再到Doug Engelbart (发明了鼠标和窗口),然后是Alto [Xerox PARC 的图形界面 PC],接着是 PC,然后到互联网。这一切的核心是,“嘿,有没有更自然的界面可以让作为人类的我们增强认知能力、,去做更多的事情?”所以是的,这是其中的例子之一。副驾是个隐喻,因为这种设计选择将人置于中心。所以开发的方向不要搞成自动驾驶——这跟副驾有关。很多人都在说,“天呐,人工智能已经来了!”你猜怎么着?人工智能早已无处不在。事实上,所有的行为定向都使用了大量的生成式人工智能。这是个黑匣子,你我都只是目标。

在我看来,未来在副驾与自动驾驶之间会有一场拉锯战。

问题是,人类如何控制这些强大的能力?方法之一是让模型本身与我们关心的核心人类价值观保持一致。这些不是技术问题,更多是社会文化方面的考虑。另一方面是设计选择以及考虑上下文的产品制作。这意味着切实保证部署这些模型的环境与安全性保持一致。

quality,q_90

摄影:Meron Menghistab

有人说我们应该对人工智能的研究踩刹车,暂停六个月,你对这些人有耐心吗?

他们说“我们得仔细考虑对齐方面的各种艰巨挑战,确保我们人工智能不会失控”,对于这些人,我一直都很尊重。如果人工智能真的要一飞冲天的话,我们最好掌控一切。回想一下蒸汽机首次部署以及工厂成立那时候。如果同时考虑到童工和工厂污染问题,我们能否避免几百年的可怕历史?因此,每当我们对一项新技术感到兴奋时,能够同时想想会有什么意外后果是很好的。也就是说,在这一点上,我不会叫停,而是说我们应该加快实现对齐需要完成的工作。我第一次看到 GPT-4 时,我们并没有匆忙推出 Sydney,为了系好安全带,我们还有很多工作要做。但我们也知道,在实验室里面是没法完成所有的对齐的。要让人工智能模型与世界保持对齐,你必须打入世界之中,而不是在某些模拟环境下保持对齐。

你知道 Sydney 会爱上记者 Kevin Roose 吗?

我们没想到有人会在 Sydney 发布后 100 小时之内对它进行荣格心理学分析。

你还没有说你是否认为人工智能有可能毁灭人类。

如果出现完全失控的情况,那就成问题了,我们不应该允许这种情况发生。说者快要失控了那是放弃了我们自己的责任。强大技术我们应付得来。顺便说一句,电也会产生意想不到的后果。但我们确保电网安全,我们制定标准,我们掌控着安全。显然,对于核能,我们的应对是管理扩散问题。这两个对于如何处理强大技术来说都不乏好的例子。

幻觉是 LLM 的一大问题,Sydney 和其他模型有时候会胡编乱造。这个问题能否有效解决?

有一些非常实用的东西可以减少幻觉。而且技术肯定会变得越来越好。会有解决方案的。但有时候幻觉也是一种“创造力”。大家应该可以选择什么时候采用哪种模式。

那会是一种改进,因为现在我们别无选择。现在我想问另一种技术。就在不久前,你对元宇宙还很狂热。 2021 年那时候,你说混合现实的突破性再怎么形容都不为过。但现在我们整天讨论的全都是人工智能。这种火爆会不会把元宇宙排挤到其他维度?

我仍然相信 [虚拟] 存在。 2016 年,我谈到了三样东西令我感到十分兴奋:混合现实、量子计算与人工智能。我对这同样的三样东西我还是很兴奋。今天人工智能是我们的谈资,但我认为(虚拟)存在是最终的杀手级应用。然后,当然了,量子会加速这一切。

人工智能不只是个讨论话题。现在,你已让这项变革性技术成为微软中心。你是怎么做到的?

在内部,我经常喜欢打这么一个比方,当我们从蒸汽机转向电力时,你得对工厂进行重新连接。不是说把蒸汽机拿掉放上电机,其他一切保持不变就万事大吉。这就是史丹利汽车公司(Stanley Motor Carriage Company)与福特汽车(Ford Motor Company)之别,福特把整个工作流都重新组织过了。所以在微软内部,软件的生产方式也在发生变化。这是微软内部核心工作流程的根本转变,以及我们对我们所取得成果的布道,每一所学校、每一个组织、每一个家庭都会发生变革。

这项工具让你的工作发生了怎样的改变?

很多知识工作都是苦差事,比如对电子邮件分类。如果我的 Outlook 没有人工智能助手的话,我都不知道这日子该怎么过。回复电子邮件不只是写篇英语作文,也可以是一张客户支持工单。它会询问我的客户支持系统并带回相关信息。这一刻就像 PC 第一次出现在工作之中一样。对我来说就是这种感觉,影响着我们全系列的产品。

微软在你任职期间表现良好,但你认为你会因为让公司向人工智能转型而被人们记住吗?

我会因为什么而被人记住应该由像你这样的人或其他人来评述。不过,天呐,我确实对此十分兴奋。微软已经 48 岁了。我不知道像这样到了这把年纪还能保持显赫地位的公司有多少,不是因为在过去 80 年代、90 年代或 2000 年代做了什么事情,而是因为在过去几年做了什么事情。只要我们做到这个,我们就有生存的权利。如果我们做不到,我们就算不上伟大。

译者:boxi。

本文来自翻译, 如若转载请注明出处。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK