4

AI 新时代,是时候重估百度了

 1 year ago
source link: https://www.geekpark.net/news/315239
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client
综合报道
8min read

AI 新时代,是时候重估百度了

2023/02/22
040fb7281132d0e16e2d415244549fdf.jpg

基于人工智能大语言模型,百度业务迎来新一轮升级。

发力 AI 近十年,百度正在迎来最好的机遇。

2 月 22 日晚间,百度发布 2022 年 Q4 及全年未经审计的财务报告。2022 年全年,百度实现营收 1236.75 亿元,归属百度的净利润(非 GAAP)206.8 亿元,同比增长 10%。

第四季度,百度实现营收 330.77 亿元,归属百度的净利润(非 GAAP)53.71 亿元,同比增长 32%。2022 财年,百度核心业务连续四个季度业绩超市场预期。

除了公布财务业绩,对于近期备受关注的类 ChatGPT 产品「文心一言」,李彦宏在电话会上表示,文心一言将率先集成进搜索产品,通过新功能吸引到更多的用户,并给广告业务带来更多机会。

2022 年以来,百度围绕文心大模型展开了一系列动作。5 月,百度提出了「构建更适配应用场景的模型体系」;11 月,文心大模型全面升级,发布了包括 5 个行业大模型在内的 11 个大模型,同时发布了 AIGC 绘画产品「文心一格」。

关于即将发布的「文心一言」,截至目前已有爱奇艺、集度、小度、智联招聘、太平洋汽车网等多个合作伙伴宣布加入百度文心一言生态圈。

2f008111069f5cd1e465789c7b54fb95.png

基于长期建立的大模型体系,百度已有的业务体系也有望迎来新一轮升级。不论是百度自身的 C 端搜索产品,还是旗下的小度音箱等产品,都能够直接接入语言大模型的能力,获得性能和体验提升。

而以 AI 能力为优势的智能云业务,接入大模型能力后,也将能够向企业客户输出语音交互、内容生成的能力,赋能软件企业。

百度创始人、董事长兼首席执行官李彦宏表示,「凭借在 AI 领域的长期投入,百度将抓住即将到来的 AI 拐点,为我们的整个业务组合——从移动生态到智能云、自动驾驶、智能硬件等——开拓全新的机遇。」

01 核心业务持平,多项主流业务与「文心一言」整合

2022 年对中国乃至全球互联网公司来说都是极其不易的一年。但整体来看,百度在 2022 财年的业绩表现依然相当稳健。

总体来看,百度的核心业务持平,营收增长由非在线营销收入贡献。李彦宏在财报会上表示,随着疫情缓解,在线营销开始出现复苏迹象。

2022 财年,百度核心业务营收为 954 亿元人民币,与去年基本持平。其中,网络营销业务营收为 695 亿元人民币,同比下降 6%。

非在线营销收入方面,2022 年的整体营收为 259 亿元人民币,同比增长 22%,主要由云计算和其它基于 AI 驱动的业务推动。

业务表现上,过去一年,百度搜索规模年同比增长 17%;移动端搜索查询次数和信息流分发量,均实现了两位数的同比增长。百度 App 月活用户数于 2022 年 12 月达到 6.48 亿,同比增长 4%。此外,2022 年前九个月,小度位居中国智能屏和智能音箱出货量第一。

在智能云业务上,百度 ACE 智能交通系统从 2021 年的 35 个城市扩展到 69 个城市,合同金额超过 1000 万元人民币。根据 IDC 2022 年上半年发布的中国公共云市场报告,百度第四年被评为第一大人工智能云供应商。李彦宏在内部信中表示,「百度智能云利用AI技术,为行业提供标准化的解决方案,提高了利润率。」

智能驾驶方面,截至 2023 年 1 月底,萝卜快跑累计订单量超过 200 万单。

51e654bb6f7882a04aa93e8fe00d877a.png

升级后的文心大模型体系|来源:百度

相比已经存在的基本盘,今天更受关注的还是百度在语言大模型方向的探索。作为百度乃至国内发布的首个类 ChatGPT 产品,文心一言的进展,背后的文心大模型,以及与现有业务结合的规划,都是外界关注的重点。

未来,百度主流业务将与文心一言整合。除了升级相关产品外,李彦宏强调了其对云服务的意义,「之前选择云厂商更多看算力、存储等基础云服务。未来,更多会看框架好不好、模型好不好,以及模型、框架、芯片、应用之间的协同。这会根本性地改变云计算市场的游戏规则。」

02 始于四年前的文心大模型

ChatGPT 出圈,让普通人也感受到语言大模型的能力与优势。而在产业界,对于大模型的探索已存在多年。谷歌等公司 5 年之前开始语言大模型的布局。对 AI 技术持续投入的百度,也在 4 年前开始了大模型的技术积累。

谷歌 2017 年发布神经网络架构 Transformer 后,语言大模型开启了新时代。Transformer 能够让机器在处理语言信息时关注单词之间的联系,并预测接下来会是什么单词。这大大增强了语言的理解能力。如果将语言大模型比喻成复杂的建筑,Transformer 便是搭建时最好用的砖头。

在此之后,所有的大模型,都基于这一架构进行设计。2018 年,谷歌发布发布了基于 Transformer 的预训练大模型 BERT;Open AI 则发布了 GPT,这是 ChatGPT 的第一代模型。

紧随其后,百度于 2019 年发布了初代文心大模型:ERNIE 1.0。这也是文心系列模型的起点,初代文心模型基于谷歌 BERT 模型结构,增加了优化设计。

预训练模型大模型可以看作一种新的研究思路。在过去,自然语言理解有各种不同的任务,如翻译、知识问答、多轮对话等。解决每一个问题,需要专门训练出模型,但能力的提升却容易遇到瓶颈。预训练模型则换了另外一种思路,先用大量数据训练出一个具备基础语言理解能力的模型,再通过少量数据的微调,让其具备处理某种任务的能力。

文心大模型优化的一个关键点在于加入了知识图谱。作为一种信息加工方式,知识图谱将现实世界中存在的概念、以及相互关系用符号表示出来,最终形成一个可视化的「图谱」。将这种方式加入预训练,就增加了大模型在知识相关任务上的能力。

在训练数据上,文心大模型也有明显特点。基于百度自身的数据优势,训练模型的语料来自百度百科、百度新闻、百度贴吧、以及中文的维基百科。这其中包含了大量的知识性的语料。

2019 年 7 月,百度再次升级模型,发布了 ERNIE 2.0,并在 2020 年全球全球规模最大的语义评测比赛 SemEval 上,获得了 5 项世界冠军。发展至今,百度语言大模型文心一言突出的能力是「知识增强」,能够生成对话、进行文本创作。

大模型是未来 AI 产业体系的重要组成,但要把大模型用起来,还需要底层算力、上层应用的共同搭建。百度也在这一方向上进行了诸多实践。

62679d3538c3f512757de9642d21d04c.png

「文心一格」平台页面 |来源:百度

直接支撑文心大模型的平台,是飞桨产业级深度学习框架。这是目前被广泛使用的深度学习框架。截至 2022 年 11 月底,飞桨平台上已凝聚 535 万开发者、创建 67 万个 AI 模型,服务 20 万家企事业单位,位列中国深度学习平台市场综合份额第一。在百度 AI 能力的整体架构中,深度学习框架位于第二层,整体的四层能力包括「底层芯片+深度学习框架+大模型+应用层」。

去年底,百度发布了最新的生成式 AI 产品「文心一言」,这是应用层的最新产品,目前已经被不少新媒体用来生产配图素材。这是一个 AI 作画平台,由飞桨学习框架和文心大模型提供技术支持。百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜介绍,百度将文心大模型已经形成「模型层 + 工具与平台层 + 产品与社区层」的整体布局。

「文心一格」产品的发布,意味着百度已经开始积累大模型的工程化落地能力,而接下来「文心一言」产品的发布,将沿着这一方向进行更多探索。

03「文心一言」融入更多业务

深度学习三巨头之一的 LeCun 表示,新的 AI 热潮,将带来企业内部深度学习研发的复兴。对于百度来说正是如此。与学术性质的研发不同,在企业中的技术研发,不仅仅涉及概念验证,还因探索与业务场景结合、规模化而需要更大成本。

如微软总裁纳拉德所说,AI 将从根本上改变每一个软件类别。如今,正来到了探索大模型与更多业务场景结合、赋能产品的加速时期。百度也已经公布了相关规划。

三月份即将发布的「文心一言」(ERNIE Bot)是基于文心大模型所发布的新的语意理解平台。从英文名 Bot 可以看出,底层的技术将是一个类似聊天机器人(Chatbot)的对话模型。「文心一言」将会利用跨模态、语言理解和生成能力等,为人们提供自然流畅的聊天体验。

对于百度来说,拥有了这样的新技术平台,首先能够提升的便是搜索产品。目前,搜索产品的收入大约占到百度整体收入的 60%,依旧是最重要的产品之一。

多年来,搜索产品的形态和用户体验没有太大的变化。当对话体验与原有的搜索引擎形成互补,用户在搜索相关链接的同时,也能够直接阅读定向生成的内容,将是十多年来搜索产品最显著的一次产品变革。这也将成为互联网的新流量入口。

这种对话能力,还能够接入智能座舱的场景中,以语音交互的形式体现。前不久的三里屯体验中心启动会上,集度 CEO 夏一平表示,「集度将融合百度文心一言的全面能力,支持汽车机器人实现自然交流的再进阶。」当新的模型能力接入汽车终端,人们在座舱内不仅能够通过语音对设备进行更全面的控制,还能够获得类似于和一个「人」交流对话的体验。

除了 C 端产品之外,模型能力也将接入百度的智能云中,为 B 端服务能力带来提升。百度集团执行副总裁、百度智能云事业群总裁沈抖表示,「文心一言」将通过百度智能云对外提供服务,率先在内容和信息相关的行业和场景落地。

将大模型的能力引入云服务,将是必然的趋势。微软此前已经表示,计划将 OpenAI 的多项技术引入 Azure 云服务中,包括 ChatGPT 以及绘画模型 DALL-E。将来,通过云服务的方式,AI 改写软件的进程才会真正发生。

百度智能云宣布,将在 5 月推出针对「文心一言」模型的 API 接口。这将使百度智能云在语音合成、机器翻译、自然语言处理方面的服务能力提升,客户可以直接调用相关能力应用到具体的场景里。

去年百度智能云年增长为 12%,在 AI 云市场位列第一。具体而言,在数字人、智慧城市等领域,百度智能云为市场份额第一。百度搜索业务之外的其它业务,主要受智能云及其他 AI 驱动业务的推动。大模型能力的接入,将带来更强的增长势能,也将拓展 AI 云的服务范围。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK