6

百度吴甜:新版文心一言能力已超ChatGPT 3.5,未来只会有少量大模型

 1 year ago
source link: https://finance.sina.com.cn/tech/it/2023-07-24/doc-imzcuyrn1948695.shtml
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

百度吴甜:新版文心一言能力已超ChatGPT 3.5,未来只会有少量大模型_新浪财经_新浪网

  新浪科技讯 7月24日下午消息,近日,IDC发布AI大模型技术能力评估报告显示,百度文心大模型3.5拿下12项指标的7个满分,综合评分第一。在面向新浪科技等媒体沟通中,百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜指出,新版本文心一言3.5已超越ChatGPT 3.5,未来国内将只会有少量大模型。

  “在OpenAI发布ChatGPT之前,真正在做大模型的企业或机构寥寥可数,过去短短几个月内,大量新的模型出现,这是一个阶段性的现象,在演变的过程当中,其实各个企业、机构会逐渐找到自己的定位,下一步逐渐会走向自己细分的方向。”吴甜表示。

  在吴甜看来,大模型的终局将会集中在少量几个大模型上。因为,真正从底层做起来的大模型成本非常高,并不是想做就能做起来的,它需要有多年的积累,需要非常综合的能力,也需要有绝对的坚定信心,一直投入下去才能够做好。所以,从这一点上可以看到,将来只能有少数的大模型。

  吴甜指出,大模型产业化面临着挺大的挑战,总结起来有三方面:第一,大模型的体积确实很大,模型大带来的训练难度高,成本高。第二,对于算力规模要求非常大,性能要求非常高。第三,数据规模也很大。我们今天为什么有这么多千亿参数规模,甚至也有万亿参数规模,它跟海量的数据上自定义强相关。数据的规模也非常大,收集、挖掘、建设、筛选这些数据,清洗这些数据本身也是非常大的大工程。

  “其实完全不要存在大量的大模型,而对于应用者来说,也不需要每一个应用都来进行大模型的开发。”吴甜表示。在他看来,大模型的产业模式,可以类比芯片代工厂,现在芯片的型号、厂商非常多,但是代工厂只有几家而已,芯片代工厂价值非常大,但整个社会不需要有非常多的企业都来实现这个能力,只要少数几家芯片代工厂,对于有芯片生产需求公司来说,只要出生产方案,交给芯片代工厂生产,就可以得到想要的芯片。(文猛)

广告

责任编辑:刘万里 SF014


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK