深耕大模型技术度小满开源国内首个千亿参数金融大模型“轩辕”-品玩

深耕大模型技术度小满开源国内首个千亿参数金融大模型“轩辕”

发布于 22小时前

当前，迅速发展的大模型正在成为AI新型基础设施，并被广泛运用于金融等多个行业。尤其是金融领域，大模型在风险管理、欺诈检测、客户服务等场景中有着重要作用，多家金融科技企业争相涌入大模型赛道。近日，在大模型领域布局已久的度小满，正式开源国内首个千亿级中文金融大模型—“轩辕”。

度小满以高质量数据集训练模型，“轩辕”处理金融领域问题优势明显

据了解，轩辕大模型是在1760亿参数的Bloom大模型基础上训练而来，在金融名词理解、金融市场评论、金融数据分析和金融新闻理解等任务上，效果相较于通用大模型大幅提升，表现出明显的金融领域优势。

在金融场景中的任务评测中，轩辕全面超越了市场上的主流开源大模型，赢得了150次回答中63.33%的胜率，充分凸显了其在金融领域的显著优势。在通用能力评测中，轩辕有10.2%的任务表现超越ChatGPT 3.5，61.22%的任务表现与之持平，涉及数学计算、场景写作、逻辑推理、文本摘要等13个主要维度。

为了提升轩辕大模型对金融领域问题的理解能力，度小满将自身业务中积累的金融领域的千亿tokens的中文预训练数据集用来训练模型。该数据集涵盖了金融研报、股票、基金、银行、保险等各个方向的专业知识。度小满表示，经过清洗和标注的高质量数据集，不仅在通用性方面与ChatGPT达到持平成为可能，且显著提升了模型在金融垂直领域的性能。

深耕人工智能技术，度小满开展一系列基于大模型的应用

那么，轩辕大模型开源后，对金融机构有何意义？度小满CTO许冬亮认为，生成式大模型在内容生成与创作、信息摘要与总结、知识理解与问答、自然交互与对话等方面具备非常出色的能力，在金融场景中会有广泛的应用。在前台，生成式大模型将大幅提升客户经理的专业水平和服务能力，大幅降低客户经理的运营成本，让每个人都拥有24小时在线的专业客户经理成为可能。出色的内容生成能力也将引发营销内容生产能力的大幅提升。

另一方面，在中台，生成式大模型有机会改变企业内知识获取、内容创作、会议与沟通、代码开发与测试的方式，进而大幅提升企业内部办公效率，甚至引发研发测试模式变革，全方位的提升金融企业内部运营效率。在后台，大模型将成为智能科技底座的标配，大幅降低智能技术应用的门槛，只需少量标注数据甚至无需调整就可以让智能技术覆盖广泛的场景。

度小满依托于百度人工智能技术，已经开展了一系列基于大模型的应用。以风险管理为例，度小满已经将大型语言模型LLM应用在互联网文本数据、征信报告的解读上，通过用文本数据构造的预训练模型以及AI算法，能够将征信报告解读出40万维的风险变量，更好的识别小微企业主的信贷风险。今年5月份，这一工程荣获了 “吴文俊人工智能科学技术奖”。今年2月份，百度基于文心大模型技术推出的生成式对话产品“文心一言”（英文名：ERNIE Bot）开放生态合作，度小满成为首家接入的金融科技公司。

借助大模型等技术，度小满提升了金融服务效率、降低了企业信贷风险等，为行业发展注入了新活力。未来，作为金融科技企业，度小满将持续关注并推动大模型技术在金融领域的落地应用。

Recommend

Microsoft-Activision Deal Temporarily Blocked by Judge

如布科技发布新产品AI口袋学习机S12-品玩

Of Bloody Daddy, Jio Cinema and how to do MVP at scale

九阳台式净饮机RH550评测：喝安全水_原创_新浪众测

How Grafana made observability accessible

Brother Day wages war to cling to power in Foundation S2 trailer

I use an AI chatbot after my mom died to ask for advice on mundane things. It wo...

Mark Cuban says healthcare has to have more of a 'Netflix model'

中科深智成维忠：在MR浪潮中未来2-3年会出现下一代巨头

AI hype could end up like the dot-com bubble, veteran investor warns: 'I'd put m...

About Joyk

深耕大模型技术 度小满开源国内首个千亿参数金融大模型“轩辕”-品玩

Recommend

About Joyk

深耕大模型技术度小满开源国内首个千亿参数金融大模型“轩辕”-品玩