3

国盛证券:大模型公司的四大发展路径

 1 year ago
source link: https://finance.sina.com.cn/tech/internet/2023-04-23/doc-imyriuyt5132856.shtml
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

国盛证券:大模型公司的四大发展路径_新浪财经_新浪网

  很多投资者会静态地看待大模型公司的发展,这是一个时代的起点,在浪潮之巅探索的企业多积累的经验可能远远超出想象,即使失之东隅,也会收之桑榆。

  Base Model提供者:赋能万物。自OpenAI发布ChatGPT以来,海内外厂商都加速布局基础大模型的研发,所有大模型的训练都分为两步:首先通过预训练形成基础模型,然后针对特定领域做微调。通过这种过程,原则上来说只要有细分领域数据,大模型就可以针对垂直领域做优化,赋能各行各业。目前国内基础大模型百花齐放,多家厂商已陆续推出大模型并开始用于自身业务或寻找行业伙伴进行落地,成为Base Model可赋能万物,拥有极大的空间。

  行业预训练大模型:比微调通用性更优。除了基础大模型,许多大模型厂商都致力于推出各类行业大模型。实际应用并不一定需要大模型具有非常全面的能力,而更需要对行业知识的理解和对行业需求的适配,在具体行业上,行业大模型的泛化等能力往往要优于基础大模型+微调。百度文心大模型与各行业企业联手,在通用大模型的基础上打造能源、金融、航天、制造、传媒等具体行业大模型。华为将大模型体系分为了基础大模型L0、行业大模型L1、细分场景模型L2三层。科大讯飞(58.040, -5.91, -9.24%)也提出“1+N”战略,“1”是通用大模型算法研发及高效训练底座平台,“N”是教育、医疗、人机交互、办公等行业大模型。

  结合模型的深度微调,通过Knowhow、数据形成场景、方案。基础大模型或者行业大模型最终需要结合实际应用场景进行落地,这个阶段需要深度微调。在用场景数据深度微调模型时,需要丰富的行业经验Knowhow进行评价和指导,前期得到的模型输出可能还并不够完美,此时就需要有行业经验的专家对模型的输出进行评价,给出修改意见,再重新结合场景数据进行深度微调。除了结合Knowhow与数据微调模型,还需要形成具体方案。每个场景所需要解决的问题不同,最终需要将模型与实际问题结合,与场景进行交互,形成具体的解决方案仍然会实现较强的效果和较大的壁垒。

  积累训练经验,转向场景与方案厂商,依旧有优势。应用落地首先要依赖大模型的基础能力,因此一方面大模型厂商将致力于提升大模型的基础能力,积累的训练经验对于模型能力提升尤其重要,同时训练经验还可以极大降低预训练新行业模型的以及模型落地新场景微调的成本和。另一方面除了大模型本身的差异,需要竞争的就是具体落地方案,在各应用场景落地解决方案的积累,可以帮助厂商更好地满足行业客户的具体需求,同时还可能对于类似客户形成规模效应。未来积累了丰富经验的厂商,将对应用行业可以提供一站式的解决方案,全方位满足客户需求。

  建议关注:

  算力:英伟达、中科曙光(53.540, -1.17, -2.14%)、海光信息(91.390, -5.91, -6.07%)、寒武纪(248.000, -18.16, -6.82%)、易华录(39.960, -6.24, -13.51%)、光通信产业链、拓维信息(14.150, -1.55, -9.87%)、常山北明(7.380, -0.54, -6.82%)、神州数码(29.340, -1.94, -6.20%)、浪潮信息(43.960, 0.98, 2.28%)、景嘉微(103.700, -13.59, -11.59%)、工业富联(18.790, -0.21, -1.11%);

  大模型及技术公司:百度、阿里、华为、360、科大讯飞、云从科技(38.940, -4.93, -11.24%)、昆仑万维(48.940, -2.44, -4.75%)、海天瑞声(175.500, -16.76, -8.72%)、拓尔思(26.180, -1.32, -4.80%)、腾讯、字节跳动等;

  应用:1)对标微软办公:微软、金山办公(448.000, -32.00, -6.67%)、彩讯股份(28.230, 0.22, 0.79%);2)多模态GPT(输入输出信号变化):大华股份(24.950, -1.81, -6.76%)、海康威视(39.720, -1.90, -4.57%)、万兴科技(115.000, 6.95, 6.43%)、千方科技(15.000, -0.35, -2.28%)、当虹科技(61.010, -5.71, -8.56%)、云从科技、萤石网络(54.990, -1.06, -1.89%)、商汤科技、中科创达(92.300, -4.80, -4.94%)、新国都(15.500, -1.80, -10.40%)等。3)互联网传媒:昆仑万维、汤姆猫(7.810, -0.41, -4.99%)、蓝色光标(10.230, -0.21, -2.01%)、中文在线(22.930, -2.87, -11.12%)、利欧股份(2.220, -0.20, -8.26%)、游戏、数字人(8.370, -0.17, -1.99%)、电商等。4)智能助理(耳机/音箱):漫步者(19.850, -0.56, -2.74%)、科大讯飞、传音控股(102.500, -11.74, -10.28%)、国光电器(15.310, -1.54, -9.14%)、恒玄科技(140.720, -17.26, -10.93%)、奋达科技(5.160, -0.57, -9.95%)、惠威科技(14.440, -1.52, -9.52%)等。5)其他优质应用:同花顺(196.200, -13.80, -6.57%)、恒生电子(49.160, -0.90, -1.80%)、金证股份(16.570, -1.53, -8.45%)、上海钢联(49.430, -3.28, -6.22%)、石基信息(20.570, -0.86, -4.01%)、汉得信息(11.750, -0.98, -7.70%)等。6) AI安全:新华网(33.700, -3.74, -9.99%)、人民网(21.410, -2.33, -9.81%)、电科网安(36.630, -4.07, -10.00%)、美亚柏科(23.620, -2.60, -9.92%)、安恒信息(219.000, -12.00, -5.19%)等。7) 国内巨头合作:光云科技(16.970, -1.85, -9.83%)、赛意信息(32.800, -5.08, -13.41%)、云鼎科技(8.440, -0.48, -5.38%)、朗新科技(23.390, -1.37, -5.53%)、润和软件(25.580, -0.87, -3.29%)、软通动力(46.060, -5.15, -10.06%)等。8)医疗应用:润达医疗(12.790, -0.11, -0.85%)、嘉和美康(45.750, -2.55, -5.28%)、卫宁健康(12.470, -0.55, -4.22%)、创业慧康(9.050, -0.42, -4.44%)。8)机器人(11.250, -0.40, -3.43%):三花智控(22.670, -0.82, -3.49%)、拓普集团(51.850, -2.58, -4.74%)、鸣志电器(40.400, -1.04, -2.51%)、绿的谐波(118.410, -4.62, -3.76%)、晶品特装(78.000, -1.43, -1.80%)。

  风险提示:AI技术迭代不及预期风险;经济下行超预期风险;行业竞争加剧风险。

  Base Model提供者:赋能万物

  自OpenAI发布ChatGPT以来,海内外厂商都加速布局基础大模型的研发,所有大模型的训练都分为两步:首先通过预训练形成基础模型,然后针对特定领域做微调。通过这种过程,原则上来说只要有细分领域数据,大模型就可以针对垂直领域做优化,赋能各行各业。

图表1:AI从训练到落地应用流程

2b02-1ba5d909fd2b80aa8ae459827c0e5dcb.png

资料来源:国盛证券研究所

  国内基础大模型百花齐放,多家厂商陆续推出大模型并开始用于自身业务或寻找具体行业伙伴进行落地。包括百度文心一言、阿里通义千问、360智脑、商汤SenseChat、昆仑万维天工大模型以及科大讯飞星火认知大模型。未来大模型厂商将成为各行业的AI基础能力供应方,赋能万物,拥有极大的空间。

  行业的预训练大模型

  除了基础大模型,许多大模型厂商都致力于推出各类行业大模型。因为具体到实际应用上,并不一定需要大模型具有非常全面的能力,而更需要对行业知识的理解和对行业需求的适配,在行业里的具体场景上,行业大模型往往比直接用基础大模型去微调具有更好的泛化能力。因此基于基础大模型和行业数据训练行业大模型,一方面可以更精准匹配行业需求,一方面也能降低成本,因为并不是所有行业都需要其他行业的知识,行业大模型相对基础大模型可以优化模型规模。

  百度文心大模型与各行业企业联手,在通用大模型的基础上学习行业特色数据与知识,建设行业AI基础设施。目前包括能源、金融、航天、制造、传媒等行业。如国家电网与百度联合发布知识增强的电力行业大模型,建设更适配电力行业场景的AI基础设施,降低数据标注成本,提升细分场景模型效果;人民网与百度在传媒行业、大数据和AI算法上结合,引入人民网舆情数据中心积淀的行业知识, 顺应内容与技术发展,联合研发知识增强的传媒行业大模型,打造全媒体时代内容科技创新引擎,加速传媒行业的智能化升级等

图表1:百度行业大模型概念图

b40a-3377094b03d9ce7b68c7a0aa770444e7.png

资料来源:

百度官网,国盛证券研究所

  4月8日,人工智能大模型技术高峰论坛上,华为云人工智能首席科学家田奇表示AI for Industries是人工智能新的爆发点,华为将大模型划分为3个层级,分别为基础大模型L0、行业大模型L1、细分场景模型L2。将基础大模型L0与行业数据结合训练得到行业大模型L1,再将行业大模型L1应用于下游细分场景,进行微调和部署,得到细分场景模型L2。华为云于2021年4月发布三个基础大模型,包括NLP大模型、CV大模型和科学计算大模型,之后又陆续发布了各种行业大模型包括气象大模型、药物分子大模型、矿山大模型、海浪预测大模型等。

图表1:华为大模型层级

2bfb-7259f2bb9246b8b1efbd7deda9f11729.png

资料来源:

央广网,国盛证券研究所

  4月20日,科大讯飞举办业绩说明会,强调公司正在推进“1+N认知大模型”战略。其中“1”是通用认知智能大模型算法研发及高效训练底座平台,“N”是应用于教育、医疗、人机交互、办公等多个领域的专用大模型版本。并将于5月6日举办认知大模型成果发布会。

  结合模型深度微调,通过Knowhow、数据形成场景、方案

  基础大模型或者行业大模型最终需要结合实际应用场景进行落地,这个阶段需要深度微调。即使大模型已经拥有强大智能,但可能缺乏特定场景的知识,也需要结合具体场景的需求,因此在落地时依然需要场景数据进行微调。

  在用场景数据深度微调模型时,需要丰富的行业经验Knowhow进行评价和指导。在通过场景数据对大模型进行微调后,前期得到的模型输出可能还并不够完美,此时就需要有行业经验的专家对模型的输出进行评价,给出修改意见,再重新结合场景数据进行深度微调。

  除了结合Knowhow与数据微调模型,还需要形成具体方案。每个场景所需要解决的问题不同,最终需要将模型与实际问题结合,与场景进行交互,形成具体的解决方案才能真正得到价值。比如对工业场景进行改造,可能涉及到模型具体需要和工厂内的哪些设备进行交互,还要考虑具体的作业流程。

  积累训练经验,转向场景与方案

  积累的训练经验,以及落地解决方案的经验,将形成厂商的竞争优势,帮助大模型厂商不断进化。应用落地首先要依赖大模型的基础能力,因此一方面大模型厂商将致力于提升大模型的基础能力,积累的训练经验对于模型能力提升尤其重要,同时训练经验还可以极大降低预训练新行业模型的以及模型落地新场景微调的成本。另一方面除了大模型本身的差异,需要竞争的就是具体落地方案,在各应用场景落地解决方案的经验积累,可以帮助厂商更好地满足行业客户的具体需求,同时还可能对于类似客户形成规模效应。未来积累了丰富经验的厂商,将对应用行业可以提供一站式的解决方案,全方位满足客户需求。

  建议关注:

  算力:英伟达、中科曙光、海光信息、寒武纪、易华录、光通信产业链、拓维信息、常山北明、神州数码、浪潮信息、景嘉微、工业富联;

  大模型及技术公司:百度、阿里、华为、360、科大讯飞、云从科技、昆仑万维、海天瑞声、拓尔思、腾讯、字节跳动等;

  应用:1)对标微软办公:微软、金山办公、彩讯股份;2)多模态GPT(输入输出信号变化):大华股份、海康威视、万兴科技、千方科技、当虹科技、云从科技、萤石网络、商汤科技、中科创达、新国都等。3)互联网传媒:昆仑万维、汤姆猫、蓝色光标、中文在线、利欧股份、游戏、数字人、电商等。4)智能助理(耳机/音箱):漫步者、科大讯飞、传音控股、国光电器、恒玄科技、奋达科技、惠威科技等。5)其他优质应用:同花顺、恒生电子、金证股份、上海钢联、石基信息、汉得信息等。6) AI安全:新华网、人民网、电科网安、美亚柏科、安恒信息等。7) 国内巨头合作:光云科技、赛意信息、云鼎科技、朗新科技、润和软件、软通动力等。8)医疗应用:润达医疗、嘉和美康、卫宁健康、创业慧康。8)机器人:三花智控、拓普集团、鸣志电器、绿的谐波、晶品特装。

  AI技术迭代不及预期风险:若AI技术迭代不及预期,NLP技术理解人类意图水平未能取得突破,则对产业链相关公司会造成一定不利影响。

  经济下行超预期风险:若宏观经济景气度下行,固定资产投资额放缓,影响企业再投资意愿,从而影响消费者消费意愿和产业链生产意愿,对整个行业将会造成不利影响,NLP技术应用落地将会受限。

  行业竞争加剧风险:若相关企业加快技术迭代和应用布局,整体行业竞争程度加剧,将会对目前行业内企业的增长产生威胁。

e736-d8b66fa29d4e78249e17270aaa73ca38.png

  具体分析详见2023年4月22日发布的报告《大模型公司的四大发展路径》

  分析师 刘高畅 分析师执业编号S0680518090001

广告

责任编辑:韦子蓉


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK