0

5.0,TiDB 栈稳了?

 3 years ago
source link: http://cio.zhiding.cn/cio/2021/0426/3133619.shtml
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

5.0,TiDB 栈稳了?

作者:王聪彬   【原创】   2021-04-26 09:56:04

关键字: TiDB 数据库 HTAP PingCAP

最近PingCAP发布了TiDB 5.0,5.0版引入MPP(Massively Parallel Processing,即大规模并行处理)架构,至此TiDB成为了具备完整HTAP能力的分布式数据库。

数据库是一个历史悠久的行业,PingCAP在其中的时间并不算长,刚刚过完6岁生日。PingCAP联合创始人兼CTO黄东旭说,我们是从零开始,一行一行代码写出的TiDB新一代分布式数据库,核心代码(自主可控率)达到100%。

最近PingCAP发布了TiDB 5.0版本,这对于PingCAP就像是一个生日礼物。尤其是值得一提的是,5.0版引入MPP(Massively Parallel Processing,即大规模并行处理)架构,至此TiDB成为了具备完整HTAP(混合事务 / 分析处理,Hybrid Transactional/Analytical Processing)能力的分布式数据库。

PingCAP联合创始人兼CTO黄东旭

做“省心、放心、不担心”的企业级数据库

PingCAP的创始团队认为基础软件必须是通用才能有更高的天花板,所以TiDB一开始就被定位为通用数据库,这等于为自己设定了一个很高的目标。

5年前PingCAP带着最早的TiDB产品去和客户交流,客户第一个问题就是你的产品有没有客户,很显然PingCAP最后被拒绝了,因为数据库对于企业是核心系统,没有一个企业愿意做小白鼠。

PingCAP第一个客户也是抱着死马当活马医的态度使用了TiDB,这是一家游戏公司,其当时的数据库不能满足广告投放系统的实施查询,这家公司的CTO恰巧是黄东旭的朋友,所以抱着试试的态度,TiDB也成了救活这个公司的产品。

就这样,TiDB的第一客户是靠“救命”积累的,而这个广告系统恰好是一个HTAP场景,似乎预示了TiDB的救命能力与实时性数据处理密不可分。

在之后,陆陆续续的打单中,客户对于TiDB的接受度也越来越高,但是客户大多都还是集中在互联网企业。黄东旭一次在和客户推介的过程中,客户说你们没有金融案例,你们不是企业级数据库。这也让PingCAP有了新方向,在不断打磨产品的同时,开拓了更多金融行业客户。

从救别人的命,到自己死不了,中间隔着一个煎熬的“死亡陷阱”。“TiDB已经经过了最危险的开源鸿沟,现在是个死不了的产品了。”黄东旭说。 

黄东旭对于一个真正的企业级数据库定义是,一个“省心、放心、别担心”的产品。“在做公司或者产品时,永远不要总想着行业趋势怎么变,而是永远投资在那些不会变的东西上,数据库也是一样,客户一定想要一个稳定而不操心的数据库。”

TiDB 5.0核心能力的释放

TiDB早在1.0版本就实现了OLTP Scale(在线事务处理的规模化扩展),4.0版本已经实现初步的HTAP能力,5.0版本在原有HTAP引擎TiFlash的基础上引入MPP架构,提供与存储匹配的分布式计算引擎,进一步提升海量数据下的并行计算与分析能力。

通过与TiDB-Server共享SQL前端,实现解析器(Parser)和优化器的共享,TiDB 向业务提供一体化的入口,能够自动选择单机执行或MPP模式,并且将事务型和分析型的负载隔离,使得双方在高并发量压力下互不干扰。场景实测显示,在相同硬件配置和数据量下,MPP有着数倍于Greenplum的执行速度。

而且TiDB 5.0基于分布式架构,支持云原生与多云,可以弹性扩展吞吐或存储,轻松应对高并发、海量数据场景,实现一栈式数据服务。企业级用户、互联网用户、SaaS厂商和独立软件开发商都可以通过一套TiDB系统构建数字场景应用,而不必关注底层架构。

TiDB 5.0在性能方面取得了巨大的进步,通过提供聚簇索引、异步提交事务、TiFlash MPP等功能,在Sysbench和TPC-C等OLTP基准测试中,获得均值50%的性能提升。

同时,TiDB 5.0 通过优化调度过程中对 I/O、网络、CPU、内存等资源的占用,大幅减少QPS(每秒查询量)因为资源被抢占而出现的性能抖动问题,在TPC-C OLTP的基准测试中,衡量TPC-C tpmC抖动标准差的值小于等于2%。

What’s Next

TiDB 5.0已经具备完整的HTAP能力,用户业务无论是事务型还是分析型,只要一套TiDB系统就可以应对数字化转型过程中“海量、实时、在线”的业务需求。

TiDB还是一个生态友好型的数据库,TiDB 5.0集成了更丰富的大数据生态,新增Kafka连接器 、支持S3存储服务,并提供多个数据迁移、导入与共享组件,方便用户在异构环境使用 TiDB。

目前TiDB帮助金融、互联网、零售、物流、制造、公共服务等行业用户构建面向未来的数据服务平台。TiDB已在全球超过1500 家头部企业的生产环境中得到应用。

可以说TiDB 5.0是一个里程碑版本,但是这并不是终点,未来PingCAP还有自己的规。黄东旭认为,所有的基础软件都会在云基础设施的背景下被重新发明一遍,PingCAP已经准备好重新出发。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK