Apr 9, 2020

并发下的 B+ Tree

并发度是一个数据库性能极其重要的指标之一，并发下的索引查询、更新表现也直接决定了整个数据库的性能。在上一篇文章中我们介绍了基于 B+ Tree 的索引实现，在这个较为复杂的数据结构下，单线程的数据更新可能就会带来多个节点的合并或者分裂操作，那么并发情况下针对于 B+ Tree 的查询和更新又要如何进行，本文将基于此问题进行大致的介绍。

上图是一棵 B+ Tree，假设现在有以下两个操作：

T1 删除 44，也就是要删除图中节点 A 的值；
T2 查询 41，也就是要定位到节点 B 中的值；

T1 操作在删除 A 中的 44 之后，为了保持 B+ Tree 的平衡，会将相邻兄弟节点 B 中的 41 “借”过来，如下图所示。

如果 T1 和 T2 是在并发条件下进行的，就有可能出现这种情况，T2 查询到了目标数据在节点 B 中，正准备去 B 中相应位置获取值，此时 T1 触发并完成了 B+ Tree 的再平衡操作，41 所在的节点由 B 变为了 A 节点，此时 T2 再去 B 中获取值，会发现并没有想要的。

以上情况是很普遍的一种并发问题，解决此问题的方法也很直接，就是加锁。另外，由于数据库中会有 read 和 write 两种操作，且大部分情况下 read 的操作更为频繁，因此为了保持 B+ Tree 在并发下的一致性，我们使用读写锁机制，读写锁具有什么样的特性，这里不再赘述。

在 B+ Tree 上获取读锁的方式比较简单，按照如下步骤：

从根节点开始获取读锁，根据要查询的值进入相应的子节点；
继续获取子节点的读锁，当成功获取子节点读锁后，释放父节点的读锁；
依次根据查询的值一致重复步骤 2，直至到达叶子节点查询到相应的值，并释放叶子节点的锁。

以上的步骤我们结合例子进行理解，还是之前的 B+ Tree，我们这次需要查找 12，也就是按照下图中的 A -> B -> C -> D 的节点顺序依次查找。

首先获取根节点 A 的读锁，然后进入子节点 B；
获取节点 B 的读锁，不能成功获取则等待尝试再次获取，成功获取后，释放 A 的读锁，进入子节点 C；
获取节点 C 的读锁，不能成功获取则等待尝试再次获取，成功获取后，释放 B 的读锁，进入叶子节点 D；
获取叶子节点 D 的读锁，不能成功获取则等待尝试再次获取，成功获取后，释放节点 C 的锁，读取节点中的数据，读取成功后释放 D 的锁，整个操作完成。

获取写锁的方式同读锁大有不同，这里涉及到一个概念就是节点是“安全”的，也就意味着节点不会发生合并或者是分裂操作。获取 B+ Tree 的写锁步骤如下：

从根节点开始，获取写锁，并进入相应的子节点；
继续在子节点获取写锁，重复此步骤，直到能够确定节点在更新操作下是安全的，即不会发生分裂或者合并行为，紧接着继续持有当前节点的锁，释放所有的父节点写锁；
继续重复获取写锁，直到更新操作完成，释放锁。

以上步骤比较难理解，举个例子来说明，如下图所示，我们需要删除其中的值 38：

同样，我们还是按照从图中的节点 A 到 B C 到 D 节点的顺序。按照上述步骤，我们从根节点 A 开始获取读锁，然后到节点 B，在节点 B 中我们并不能判断出删除 38 这个操作会有什么影响，因此继续持有节点 A 和 B 的写锁，然后到达节点 C。

在节点 C 中，我们可以判断出节点 C 就算删除一个元素也仍然满足节点内元素的最少个数要求，并不会引起节点的合并，此时我们可以说节点 C 是“安全”的，因此释放 C 所有的父节点的写锁，也就是释放 A 和 B 的写锁。此时继续到达节点 D，获取节点 D 的写锁，并释放节点 C 的写锁。删除目标值 38 后，释放 D 的写锁，操作完成。

我们继续举个例子，还是上图中同样的 B+ Tree，这时我们要新增一个数据 45。同样，我们从根节点 A 开始获取写锁，到节点 B 并获取 B 的写锁，此时我们发现节点 B 有多余的空间，也就是说对于这个插入操作来说，就算会触发再平衡操作，B 节点也是有位置存放数据不会进行分裂，因此 B 节点是安全的，所以此时释放 B 的父节点 A 的写锁。

然后到达节点 C 获取 C 的写锁，此时我们无法判断 C 需不需要进行分裂，所以继续持有节点 B 的写锁。然后到达节点 E，获取 E 的写锁，此时发现节点 E 有多余的空间可以容纳新插入的值 45，因此节点 E 是安全的，那么释放 B 和 C 的写锁。然后插入新值，释放 E 的写锁，完成操作。

上面介绍了 B+ Tree 如何获取读写锁，我们发现在获取写锁时，有可能会发生从根节点到叶子节点的整个路径全部被锁住了的情况，这样是严重影响并发度的，从而影响整个数据库的性能。那么写锁还有没有优化的空间呢？

在实际的数据库中，一个 B+ Tree 中的节点大概能容纳几百个元素，也就是说并不会像我们上面举的例子一样频繁地进行节点合并和分裂，我们基于这一点，假设在更新 B+ Tree 的操作中，所有节点都是“安全”的，那么获取写锁的方式就同获取读锁的方式是完全一致的：获取子节点写锁后，释放父节点写锁。

但是，写锁和读锁是不同的，写锁是完全排他的，而读锁是对读操作共享的。于是，我们可以对写锁进行这样的优化：

基于所有节点都是“安全”的假设前提下，从根节点开始以读锁的方式获取，也就是在根节点 A 中获取读锁，达到子节点 B，成功获取 B 的读锁后释放 A 的读锁，依此往下；
直到到达叶子节点，此时获取叶子节点的写锁，然后进行数据更新；
此时面临两种情况：
1. 符合假设，并不会引起节点的合并或者分裂，那么直接更新数据，释放叶子节点的写锁，完成操作；
2. 不符合假设，会引起节点的合并或者分裂，此时重新开始，fallback 到原本的写锁实现，从根节点开始获取写锁进行数据更新操作。

上述的例子中，我们仅仅是对某一个确定的值进行查询或更新，这样的效果是路径都是单向的，也就是说路径都是从根节点到叶子节点结束，这样的单向获取锁的路径并不会因其死锁的产生。

但是 B+ Tree 的特点决定了事情并不是这么简单，B+ Tree 的一个很重要的特性是能够在叶子节点中进行顺序遍历操作。比如我们要在 B+ Tree 中进行范围查找，查找 key < 35 的值，如下图所示：

这里是进行查询操作，我们按照上述读锁的步骤进行查询，也就是从 A 开始获取读锁，然后依次获取 C 的读锁后释放 A 的读锁，再在叶子节点中进行遍历获取 B 的读锁后释放 C 的读锁，读取 < 20 的值后释放 B 的读锁完成操作。

但假设，现在又有一个查询 T2: key > 10 开始了，在进行 T1: key < 35 的查询过程中，T1 已经获取 C 的读锁，尚未获取到 B 的读锁，而 T2 获取到了 B 的读锁，尚未获取到 C 的读锁。

此时，T1 和 T2 都在等待获取多方已持有的锁，死锁的情况就发生了。可惜的是，没有一个很好的方案能够有效避免这种死锁情况的发生。最有效的解决方法就是超时机制，在等待获取锁等待到了一定时间后，直接放弃，重新开始操作，一般即可解决。

本文作为上一篇关于 B+ Tree 介绍的补充，简单介绍了 B+ Tree 是如何增加读写锁来处理并发下的竞争问题的，另外还提到了如何简单地优化增加写锁的效率，希望读完此文后对 B+ Tree 会有更深的理解。

参考资料：CMU 15-445/645

并发下的 B+ Tree | CS Pro

Apr 9, 2020

并发下的 B+ Tree

Recommend

搞懂React源码系列-React Diff原理(苏溪云的博客)

被虎牙主播骗了 2100，有找回的概率吗？

浅谈零样本网络表示学习

80% 的企业采用半自动化构建知识图谱，全自动化什么时候实现？

打造企业级pipeline服务的18个疑问

不谈宽泛的智能运维，聊聊我在用的异常检测核心算法

中科院如何批量复制AI独角兽？

kubernetes 高可用的配置-flyfish

一篇教会你写90%的shell脚本！-匠心Java的博客

编译安装的mysql如何更改文件路径-Zabbix_Z大叔的博客

About Joyk

并发下的 B&#43; Tree | CS Pro

Apr 9, 2020

并发下的 B+ Tree

Recommend

About Joyk

并发下的 B+ Tree | CS Pro