1

你的 SQL 还在回表查询吗?快给它安排上覆盖索引

 2 years ago
source link: https://my.oschina.net/u/4641354/blog/5252749
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

什么是回表查询

小伙伴们可以先看这篇文章了解下什么是聚集索引和辅助索引:Are You OK?主键、聚集索引、辅助索引,简单回顾下,聚集索引的叶子节点包含完整的行数据,而非聚集索引的叶子节点存储的是每行数据的辅助索引键 + 该行数据对应的聚集索引键(主键值)。

假设有张 user 表,包含 id(主键),name,age(普通索引)三列,有如下数据:

id name age
1 Jack     18
7 Alice     28
10 Bob      38
20 Carry     48

画一个比较简单比较容易懂的图来看下聚集索引和辅助索引:

  • 聚集索引:

    2dd1f492-ad7e-4d1f-8a82-84c7b078aaed.png
  • 辅助索引(age):

    25b28e1b-4d49-4865-891f-8b103e08c1d2.png

如果查询条件为主键,则只需扫描一次聚集索引的 B+ 树即可定位到要查找的行记录。举个例子:

select * from user where id = 7;

查找过程如图中绿色所示:

6c2ecdfc-4f6c-4e02-af8f-74b305229923.png

如果查询条件为普通索引(辅助索引) age,则需要先查一遍辅助索引 B+ 树,根据辅助索引键得到对应的聚集索引键,然后再去聚集索引 B+ 树中查找到对应的行记录。举个例子:

select * from user where age = 28;

上述 select * 等同于 select id, age, name 对吧,id 是主键索引,age 是普通索引,而 name 并不存在于 age 索引的 B+ 树上,所以通过 age 索引查询到 id 和 age 的值之后,还需要去聚集索引上才能查到 name 的值。

如图所示,第一步,查 age 辅助索引:

a488729d-1e42-4417-84af-2299922db894.png

第二步,查聚集索引:

2dd1f492-ad7e-4d1f-8a82-84c7b078aaed.png

这就是所谓的回表查询,因为需要扫描两次索引 B+ 树,所以很显然它的性能较扫一遍索引树更低。

什么是覆盖索引

覆盖索引的目的就是避免发生回表查询,也就是说,通过覆盖索引,只需要扫描一次 B+ 树即可获得所需的行记录。

如何实现覆盖索引

上文解释过,下面这个 SQL 语句需要查询两次 B+ 树:

select * from user where age = 28;

我们将其稍作修改,使其只需要查询一次 B+ 树:

select id, age from user where age = 28;

之前我们的返回结果是整个行记录,现在我们的返回结果只需要 id 和 age。

id 是什么?主键索引(聚集索引),age 是什么?普通索引(辅助索引),age 索引的 B+ 树的叶子节点存储的是什么?辅助索引键 + 对应的聚集索引键

所以这条 SQL 语句只需要扫描一次 age 索引的 B+ 树就行了

a488729d-1e42-4417-84af-2299922db894.png

这样,结合这个例子,不知道各位有没有受到启发,如何实现覆盖索引拒绝回表查询呢?

答:联合索引。

我们把 age,name 设置为联合索引:

create index idx_age_name on user(`age`,`name`);

此时 age 和 name 作为辅助索引键都在同一棵辅助索引的 B+ 树上,所以只需扫描一次这个组合索引的 B+ 树即可获取到 id、age 和 name,这就是实现了索引覆盖

覆盖索引的常见使用场景

在下面三个场景中,可以使用覆盖索引来进行优化 SQL 语句:

1)列查询回表优化(如上面讲的例子,将单列索引 age 升级为联合索引(age, name))

2)全表 count 查询

举个例子,假设 user 表中现在只有一个索引即主键 id:

select count(age) from user;

可以用 explain 分析下这条语句,如果 Extra 字段为 Using index 时,就表示触发索引覆盖:

b56c6ae3-77d9-4ddb-b7d8-d95f8f6d3c83.png

显然现在是没有触发覆盖索引的,我们来优化下:将 age 列设置为索引 create index idx_age on user(age),这样只需要查一遍 age 索引的 B+ 树即可得到结果:

54394065-0f9a-4cbc-bbb0-99a64d3c5357.png

3)分页查询

select id, age, name from user order by username limit 500, 100;

对于这条 SQL,因为 name 字段不是索引,所以在分页查询需要进行回表查询。

40699843-747a-4bf3-9207-8396aefebfc6.png

Using filesort 表示没有使用索引的排序,或者说表示在索引之外,需要额外进行外部的排序动作。看到这个字段就应该意识到你需要对这条 SQL 进行优化了。

使用索引覆盖优化:将 (age, name) 设置为联合索引,这样只需要查一遍 (age, name) 联合索引的 B+ 树即可得到结果。

3c54052d-5402-47f5-8fda-8d9284a95871.png

我是小牛肉,长风破浪会有时,小伙伴们下篇文章再见 👋



f4308123-1cad-4bcc-bbb0-20a5422646b5.png

84d52766-cfd2-462d-8b6f-4921ed11ef7e.jpg

  • 博主小硕在读,深耕 Java,目前在维护一个教程类仓库 CS-Wiki「Gitee 官方推荐项目,现已 1.9k+ star,仓库地址:https://gitee.com/veal98/CS-Wiki」,公众号上的文章也会在此同步更新,欢迎各位前来交流学习

  • 准备春招秋招的小伙伴可以参考这个论坛项目  Echo 「Gitee 官方推荐项目,现已 1.1k+ star,仓库地址:https://gitee.com/veal98/Echo」。配套教程正在同步更新中,公众号后台回复 "Echo" 即可免费获取。

2d4b261b-c3fc-4a7c-81db-93eb23422c74.png

本文分享自微信公众号 - 飞天小牛肉(CS-Wiki)。
如有侵权,请联系 [email protected] 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK