4

浅析金融信息化研究所《金融业数据库创新发展报告》(2023)

 8 months ago
source link: http://tech.caijing.com.cn/20240104/4982305.shtml
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

浅析金融信息化研究所《金融业数据库创新发展报告》(2023)

日前,北京金融信息化研究所副总经理黄程林博士在金融业数据库技术大会发布了《金融业数据库创新发展报告》(2023)(下简称《创新报告》)。《创新报告》由金融信息化研究所牵头,国内头部银行和数据库企业参编,内容蕴含了每年金融行业数据库重大趋势和潜在监管走向,是国内金融行业数据库最有价值的研究素材之一。

整体趋势:集中式数据库仍占主流,新型数据库技术使用加强

《创新报告》指出,金融业数据库中,集中式数据库“以其较强的功能黏性、优秀的系统稳定性、良好的软硬适配能力,目前在金融业的应用仍占据绝大多数份额”。而分布式数据库因能“更有效支持海量、高并发、高吞吐量的新型金融业务应用系统,在金融业的应用占比相较2022年调研结果实现了5.76%的增长。”

这一结论需结合2022年金融信息化研究所发布的《金融业数据库供应链安全发展报告》来看。2022年报告中的调查数据显示,金融行业集中式数据库占比达到89%,分布式数据库则为11%;故可得知2023年分布式数据库占比为17%左右。此外,《创新报告》指出分布式数据库的长处在于“能更有效支持新型金融业务应用系统”,这也客观反映了金融行业中“传统业务用集中式数据库,新型业务用分布式数据库”的格局情况。

W020240104598144571418

《金融业数据库供应链安全发展报告》(2022)金融业集中式数据库占比情况

与2022年发布的报告相比,《创新报告》中更多关注了新型数据库在金融行业的使用情况。除分布式数据库外,OLAP、HTAP类数据库合并占比已超过20%,非关系型数据库占比达到14.58%,整体呈现上升势态。在数据库支持数据能力建设章节中介绍了数据仓库、图数据库、向量数据库等新型数据库,并指出金融业数字化加速发展对新型数据库提出更多诉求,应当不断提升新型数据库应用比例,促进能力提升。近年来国内数据库创新热潮不断,除传统数据库外,这些新型数据库领域也十分值得技术与资本关注,尤其是在金融行业加速数字化、AI技术大热的背景下,新型数据库将有很广阔的应用前景和市场。

关键变化:首次明确定义核心系统需求,存算分离架构被多次强调

在《创新报告》中,核心系统的需求首次被定义,将成为各大金融机构核心系统建设的重要参考。核心系统需求被定义为4大方面:功能、性能、鲁棒性和安全。

在功能方面,《创新报告》指出,核心系统数据库在兼容传统数据类型、对象类型、SQL和PL/SQL等基本功能外,特别需要兼容现有国际主流数据库的驱动、语法、架构等方面。

在性能方面,《创新报告》明确指出“核心系统数据库交易处理能力需稳定支持1至2万TPS,峰值支持2至4万TPS。核心系统的OLTP场景要求数据库响应时间能够达到毫秒甚至亚毫秒级别,OLAP场景要求数据库响应时间能够达到秒甚至毫秒级别”。

在鲁棒性方面,《创新报告》要求“数据100%可靠、可用性99.999%”,灾备能力“RTO秒级、RPO=0”,“故障在线修复、自愈”,均为金融行业监管规定中的明确要求。

在安全性方面,《创新报告》明确提出“3A+E”的能力要求,其中对商用加密算法、数据脱敏、数据遮蔽的支持被特别提出。由于数据加密等功能对数据库产品性能影响较大,数据库厂商应关注这一变化,尽快通过自主研发或产业合作解决性能问题。

在《创新报告》中,数据库对存储的支持被多次提及,这是往年报告中不曾存在的现象。在分析我国核心系统数据库面临的挑战时,特别提到当前我国数据库对共享集群、存算分离等方面存在差距;在分析如何推动核心系统数据库转型升级时,又提到要“我国在存储、计算、网络方面已经取得的产业优势和成熟经验,联合创新”,要“通过主备架构、多主架构、共享存储集群、分布式集群等架构,实现数据库的高可用性和容灾能力,设置自动故障切换和数据同步机制,确保系统在发生故障时能够快速切换到备用节点,并提供持续的服务”。结合近年来我国数据库产业和存储产业多次握手,金融监管机构和研究机构正高度重视数据库存算分离架构带来的重要价值,并牵引我国数据库向这一架构演进。

W020240104598144617815

 未来展望:社区成为开源风险应对中坚,统筹协作是产业发展重要模式

今年《创新报告》对开源风险给予前所未有的重视,并将开源数据库应用风险识别为开源协议风险、安全漏洞风险、知识产权/代码感染风险、开源停服/断供风险,政策的不确定性风险及掌控和服务能力不足风险等多个子类,并加以详细分析,值得数据库管理员们认真学习:

一、开源协议风险主要在于开源数据库产品可能存在多个开源项目嵌套,其中某个开源项目的协议如果发生变化,将给企业带来极其隐蔽的侵权风险。

二、安全漏洞风险主要是开源代码可能存在安全漏洞,或被植入恶意代码,给企业带来安全风险,如去年沸沸扬扬的log4j漏洞即属于这类风险。

三、知识产权侵权、代码感染风险主要源自于部分国内数据库产品封装国外开源数据库内核代码,并进行二次开发后,导致代码感染,可能受到国外开源体系限制带来风险。

四、开源停服、断供风险主要来自于企业使用的开源数据库如果出现停止服务支持,可能导致现网系统缺乏维护、漏洞无法及时修复等问题,近期MySQL 5.7版本停服即属于此类风险。

五、政策不确定性风险主要来源于后续政策是否认定国外开源数据库及基于其二次开发的产品满足监管要求带来的不确定性,企业可能面临既有技术路线的纠错、纠偏;掌控和服务能力不足风险。

六、掌控和服务能力不足风险主要来源于开源数据库功能完整度不足、运维/配置/架构文档不足、运维能力和人才不足带来的产品系统性缺陷,企业在面临这些缺陷时往往极其被动。

如何防范开源风险?《创新报告》除了建议金融机构通过增加专人、测试工具、管理流程等方式加强开源软件治理外,也建议在行业主管部门的指导下,由权威的第三方行业组织推动建设金融开源数据库社区,加强产学研用多方协作,引导生态链各方积极参与开源社区。过去国内数据库论坛虽然活跃度高,但更多是从业者或技术爱好者出于兴趣汇聚而成,对行业应用影响力有限;后续行业主管部门可能加强与数据库论坛和开源社区的连接,把技术力量联合起来完成开源风险应对策略制定、技术选型方向规划、开源风险预警等工作,并对行业应用形成以技术为主导的牵引作用。

主管部门统筹协作可能是未来我国金融行业数据库发展的潜在方向。我国数据库催熟关键在于应用;而要做到产用协同,除了靠数据库厂商拓展、金融机构自发使用和监管要求外,主管部门统筹牵引也至关重要。未来,在主管部门的牵引下,期望能够真正把产学研用凝聚起来,集中力量做大事,加速我国数据库产业振兴。

(责任编辑:刘朋)

编辑:赵欣宇

Recommend

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK