3

Meta生成式AI竞赛下一站:让开发者靠开源大模型挣钱

 1 year ago
source link: https://www.36kr.com/p/2304343873989895
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

Meta生成式AI竞赛下一站:让开发者靠开源大模型挣钱

智东西·2023-06-16 12:58
生成式AI竞赛升温,Meta考虑放宽开源AI大模型访问范围。
v2_7490bd3704a14f05b6c64d139f60d9c6@000000_oswg287794oswg900oswg383_img_000

智东西6月16日消息,今天凌晨,据外媒The Information报道,Meta CEO马克·扎克伯格(Mark Zuckerberg)正在考虑将开源大型语言模型LLaMA的新版本商业化,让其它公司免费使用LLaMA开发相关AI软件,并允许开发者将这些产品用于商业用途。 

最初,Meta仅将开源大型语言模型LLaMA授权给学术界的研发人员使用,此次将其开源模型用于商业用途或许会颠覆谷歌、OpenAI、微软等公司的商业模式,因为它们一直是以付费形式让开发者获得其大型语言模型的访问权。 

知情人士透露,此举可能会引发AI相关开发人员的狂热支持,因为这些开发者希望获得谷歌、OpenAI出售的相关付费软件的替代品。同时,这也有助于Meta改进自己的AI模型。

但Meta的开源大型语言模型用于商业用途的计划现在已经面临诸多挑战,此前也有相关信息爆出,OpenAI正准备向公众发布一种新的开源大型语言模型,并且大型语言模型商业化意味着Meta用于训练的数据将受到更加严格的法律监管,一旦被发现其数据中包含受版权保护的部分,Meta将承担相应的法律责任。 

01.此前仅做研究用途,LLaMA广泛应用受限

今年2月,Meta发布了开源大型语言模型第一个版本LLaMA,可以帮助学术界的研究人员开发ChatGPT的替代品。

v2_3c1e9e62aa7242d3a68ad741b7e61eb7@000000_oswg387887oswg1024oswg734_img_000

▲LLaMA相关研究论文

Meta的大型语言模型虽然只被授权用于研究,但仍然在业内产生了不小的影响。研究人员使用LLaMA来开发开源模型,例如130亿参数规模的开源模型Vicuna,其性能在某些指标上已接近OpenAI、谷歌的大型语言模型。

同时,这一开源大型语言模型在研究领域的应用也能帮助Meta改进自己的产品和模型。今年4月,扎克伯格在与股票分析师的电话会议上称,开发人员开始采用、改进这些模型或者修补安全漏洞,与此同时,Meta也可以将他们对模型的优化集成到自己的大型语言模型中,同时使自己的消费者或者广告产品的体验更好。

扎克伯格此前曾提到,他希望使用社交平台Facebook的小型企业和内容创作者都能拥有“AI agents(AI代理)”,这些代理可以帮助企业和内容创作者自动与客户或者粉丝沟通,代替他们完成工作。他在上周接受采访时说:“LLaMA或它背后的大型语言模型基本上将成为推动它的引擎。”

此前,Meta选择将LLaMA用于研究,所以目前其大型语言模型并不能用于商业目的,这也进一步限制了LLaMA的更广泛应用,同时决定了它被应用于商业应用程序的难度更大。

而特殊情况下,LLaMA也能用于商业用途,但会存在很多限制,比如应用程序访问的专用服务器供应量并不充足,并且这类服务器的成本会更高。

02.开源模型或面临法律风险,OpenAI也要将开源提上日程?

现在已经有一些开源大型语言模型发布,或者有相应公司已经将大型语言模型提上日程,因此Meta在开源AI的竞赛中可能面临诸多竞争。 

6月初,阿联酋阿布扎比科技创新研究所开发了开源大型语言模型Falcon,该模型已经受到众多开发者青睐。

5月初,The Information曾报道过,有知情人士透露,OpenAI正准备向公众发布一种新的开源大型语言模型。这一计划如果能被推进下去,OpenAI可能会进一步对AI行业产生重大影响。

还有一位直接知情的人士透露,OpenAI已经内部讨论过将大型语言模型用于商业用途。但值得注意的是,这一大型语言模型的性能可能与其最先进的GPT-4有一定差距。

除其它大型语言模型的竞争外,Meta将其下一个版本的大型语言模型商业化时,如果一旦被发现其使用受版权保护的数据进行训练,可能使该公司承担潜在的法律责任。 

上个月,Meta的首席AI科学家Yann LeCun在接受采访时也提到了为什么Meta迄今尚未许可LLaMA用于商业用途,他谈到两个原因,首先他并不是唯一参与此类决定的人,其次这一决定的执行可能存在法律责任问题。

不过,据一位直接了解情况的Meta前员工称,Meta在发布LLaMA第一个版本的时候就解决了法律问题,当时Meta的法律、产品、隐私部门的员工就如何将其授权给开发者进行了广泛的讨论。

Meta和OpenAI的发言人都拒绝就上述信息置评。

03.结语:开源让生成式AI竞赛继续升温

此前,Meta将LLaMA模型开源开放,就在业界引起了广泛讨论。其中,谷歌高级工程师卢克•塞尔瑙(Luke Sernau)关于开源大型语言模型的一份内部备忘录引起了众多开发者共鸣,他提到,“如果有免费、高质量的替代品,谁还会为有使用限制的谷歌产品付费?”。尽管他可能夸大了开源大型语言模型的影响力以及开源带来的挑战,但他的一个观点得到了众多从业者的认可,那就是Meta将从发布其开源模型中获益。 

据了解,LLaMA发布几周后学术界就通过这一模型开发了开源软件,打造了ChatGPT等软件的免费替代产品。 

现在,Meta要将新版本的大型语言模型用于商业用途,又有相关爆料显示,OpenAI也将加入开源大型语言模型的竞赛中,下一步围绕开源可能会成为AI产业玩家们的又一大竞争点。 

本文来自微信公众号“智东西”(ID:zhidxcom),作者:程 茜,36氪经授权发布。

该文观点仅代表作者本人,36氪平台仅提供信息存储空间服务。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK