4

深耕大模型技术 度小满开源国内首个千亿参数金融大模型“轩辕”-品玩

 1 year ago
source link: https://www.pingwest.com/a/283791
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

深耕大模型技术 度小满开源国内首个千亿参数金融大模型“轩辕”-品玩

top-ad_1db2933.png

业界动态

深耕大模型技术 度小满开源国内首个千亿参数金融大模型“轩辕”

鸠鸠

发布于 22小时前

article-thumb-lg

当前,迅速发展的大模型正在成为AI新型基础设施,并被广泛运用于金融等多个行业。尤其是金融领域,大模型在风险管理、欺诈检测、客户服务等场景中有着重要作用,多家金融科技企业争相涌入大模型赛道。近日,在大模型领域布局已久的度小满,正式开源国内首个千亿级中文金融大模型—“轩辕”。

度小满以高质量数据集训练模型,“轩辕”处理金融领域问题优势明显

据了解,轩辕大模型是在1760亿参数的Bloom大模型基础上训练而来,在金融名词理解、金融市场评论、金融数据分析和金融新闻理解等任务上,效果相较于通用大模型大幅提升,表现出明显的金融领域优势。

article-body

在金融场景中的任务评测中,轩辕全面超越了市场上的主流开源大模型,赢得了150次回答中63.33%的胜率,充分凸显了其在金融领域的显著优势。在通用能力评测中,轩辕有10.2%的任务表现超越ChatGPT 3.5,61.22%的任务表现与之持平,涉及数学计算、场景写作、逻辑推理、文本摘要等13个主要维度。

为了提升轩辕大模型对金融领域问题的理解能力,度小满将自身业务中积累的金融领域的千亿tokens的中文预训练数据集用来训练模型。该数据集涵盖了金融研报、股票、基金、银行、保险等各个方向的专业知识。度小满表示,经过清洗和标注的高质量数据集,不仅在通用性方面与ChatGPT达到持平成为可能,且显著提升了模型在金融垂直领域的性能。

深耕人工智能技术,度小满开展一系列基于大模型的应用

那么,轩辕大模型开源后,对金融机构有何意义?度小满CTO许冬亮认为,生成式大模型在内容生成与创作、信息摘要与总结、知识理解与问答、自然交互与对话等方面具备非常出色的能力,在金融场景中会有广泛的应用。在前台,生成式大模型将大幅提升客户经理的专业水平和服务能力,大幅降低客户经理的运营成本,让每个人都拥有24小时在线的专业客户经理成为可能。出色的内容生成能力也将引发营销内容生产能力的大幅提升。

另一方面,在中台,生成式大模型有机会改变企业内知识获取、内容创作、会议与沟通、代码开发与测试的方式,进而大幅提升企业内部办公效率,甚至引发研发测试模式变革,全方位的提升金融企业内部运营效率。在后台,大模型将成为智能科技底座的标配,大幅降低智能技术应用的门槛,只需少量标注数据甚至无需调整就可以让智能技术覆盖广泛的场景。

度小满依托于百度人工智能技术,已经开展了一系列基于大模型的应用。以风险管理为例,度小满已经将大型语言模型LLM应用在互联网文本数据、征信报告的解读上,通过用文本数据构造的预训练模型以及AI算法,能够将征信报告解读出40万维的风险变量,更好的识别小微企业主的信贷风险。今年5月份,这一工程荣获了 “吴文俊人工智能科学技术奖”。今年2月份,百度基于文心大模型技术推出的生成式对话产品“文心一言”(英文名:ERNIE Bot)开放生态合作,度小满成为首家接入的金融科技公司。

借助大模型等技术,度小满提升了金融服务效率、降低了企业信贷风险等,为行业发展注入了新活力。未来,作为金融科技企业,度小满将持续关注并推动大模型技术在金融领域的落地应用。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK