3

为什么MySQL字符串不加引号索引失效?《死磕MySQL系列 十一》

 2 years ago
source link: https://segmentfault.com/a/1190000041080932
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

群里一个小伙伴在问为什么MySQL字符串不加单引号会导致索引失效,这个问题估计很多人都知道答案。没错,是因为MySQL内部进行了隐式转换。

本期文章就聊聊什么是隐式转换,为什么会发生隐式转换。

字符串可以这样加索引,你知吗?《死磕MySQL系列 七》

无法复现的“慢”SQL《死磕MySQL系列 八》

什么?还在用delete删除数据《死磕MySQL系列 九》

MySQL统计总数就用count(*),别花里胡哨的《死磕MySQL系列 十》

文章总目录

一、几大索引失效原因

你肯定在网上看到过非常多关于索引失效原因的文章,但是一定要自己亲手尝试一下,因为版本不同引发的结果不会一致。

1.带头大哥不能死

这局经典语句是说创建索引要符合最左侧原则。

例如表结构为u_id,u_name,u_age,u_sex,u_phone,u_time

创建索引为idx_user_name_age_sex

查询条件必须带上u_name这一列。

2.不在索引列上做任何操作

不在索引列上做任何计算、函数、自动或者手动的类型转换,否则会进行全表扫描。简而言之不要在索引列上做任何操作。

3.俩边类型不等

例如建立了索引idx_user_name,name字段类型为varchar

在查询时使用where name = kaka,这样的查询方式会直接造成索引失效。

正确的用法为where name = "kaka"。

4.不适当的like查询会导致索引失效

创建索引为idx_user_name

执行语句为select * from user where name like "kaka%";可以命中索引。

执行语句为select name from user where name like "%kaka";可以使用到索引(仅在8.0以上版本)。

执行语句为select * from user where name like ''%kaka";会直接导致索引失效

5.范围条件之后的索引会失效

创建索引为idx_user_name_age_sex

执行语句select * from user where name = 'kaka' and age > 11 and sex = 1;

上面这条sql语句只会命中name和age索引,sex索引会失效。

复合索引失效需要查看key_len的长度即可。

总结:%在后边会命令索引,当使用了覆盖索引时任何查询方式都可命中索引。

以上就是咔咔关于索引失效会出现的原因总结,在很多文章中没有标注MySQL版本,所以你有可能会看到is null 、or索引会失效的结论。

二、从规则方面说明索引失效的原因

问题的答案就是第3点,两边类型不一致导致索引失效。

下图是表结构,目前这个表存在两个索引,一个主键索引,一个普通索引phone。

分别执行以下两条SQL语句

explain select * from evt_sms where phone = 13020733815;

explain select * from evt_sms where phone = '13020733815';

在这里插入图片描述

从上图可看出,执行第一条SQL没有使用到索引,第二条SQL却使用到了索引。

不错,你也发现了两条SQL的不同,第二条SQL跟第一条SQL逻辑一致,不同的是一个查询条件有引号,一个没有。

问题:为什么逻辑相同的SQL却是用不了索引

选择索引是优化器大哥的工作,大哥做事肯定轮不到咱们去教,因为大哥有自己的一套规则。

对于优化器来说,如果等号两边的数据类型不一致,则会发生隐式转换。

例如,explain select * from evt_sms where phone = 13020733815;这条SQL语句就会变为explain select * from evt_sms where cast(phone as signed int) = 13020733815;

由于对索引列进行了函数操作,从而导致索引失效。

问题:为什么会把左侧的列转为int类型呢?

优化器大哥就是根据这个规则进行判断,是把字符串转为数字,还是把数字转为字符串。

若返回1,则把字符串转为数字。

若返回0,则把数字转为字符串。

问题:select * from evt_sms where id = "193014410456945216"这条SQL语句能用上索引吗?

如果你忘记了表结构,可以翻到文章开头再看下表evt_sms的索引。

可以知道列id添加了主键索引,类型为int类型。

根据规则得到,MySQL8.0以上的版本是将字符串转为数字。

所以说,函数操作的是等号右边的数据,跟索引列没有关系,所以可以用上索引。

那么来到数据库验证一下结论,你答对了吗?

三、从索引结构说明索引失效原因

有这样一个需求,要统计每年双11注册用户数量。

可以看到在evt_sms表中是没有给create_time创建索引的,于是你会执行alter table evt_sms add index idx_ctime(create_time),给create_time添加上索引。

接着你就执行了下面的SQL语句。

explain select count(*) from evt_sms where month(create_time) = 11;

上线没一会数据库出现了大量的慢查询,导致非常多的SQL返回失败。

此时公司大牛肯定会直接指出问题,索引列进行函数操作。

问题:为什么索引列使用函数就用不上索引了呢?

你现在看到的create_time索引结构图。

若此时执行的是where create_time = '2021-11-16',那么MySQL就会非常快的等位到对应位置,并返回结果。

但是,做了函数操作,例如month(2021-11-16)得到的值是11。

当MySQL拿到返回的这个11时,在索引结构中根据就不知道怎么办。MySQL之所以能使用快速定位,是因为B+树的有序性。

而使用了函数对索引列进行操作后就会破坏索引的有序性,因此优化器大哥会选择执行代价最低的索引来继续执行。

本期文章给大家介绍了两个案例,一个隐式转换,一个对索引列进行函数操作。

两种情况的本质是一样的,都是在索引列上进行了函数操作,导致全表扫描。

类似于这两种情况的还是字符集问题,不过一般这个问题会会很少发生,如有新业务需要新创建表,都会设置为之前的字符集。

两张表的字符集不同在进行join时也会导致隐式字符集转换,导致索引失效。

坚持学习、坚持写作、坚持分享是咔咔从业以来所秉持的信念。愿文章在偌大的互联网上能给你带来一点帮助,我是咔咔,下期见。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK