目录

最左匹配

目录

索引的底层是一颗B+树,那么联合索引当然还是一颗B+树,只不过联合索引的健值数量不是一个,而是多个。构建一颗B+树只能根据一个值来构建,因此数据库依据联合索引最左的字段来构建B+树。 例子:假如创建一个(a,b)的联合索引,那么它的索引树是这样的

https://gitee.com/lienhui68/picStore/raw/master/null/20201001010807.png

可以看到a的值是有顺序的,1,1,2,2,3,3,而b的值是没有顺序的1,2,1,4,1,2。所以b = 2这种查询条件没有办法利用索引,因为联合索引首先是按a排序的,b是无序的。

可以看到a的值是有顺序的,1,1,2,2,3,3,而b的值是没有顺序的1,2,1,4,1,2。所以b = 2这种查询条件没有办法利用索引,因为联合索引首先是按a排序的,b是无序的。

同时我们还可以发现在a值相等的情况下,b值又是按顺序排列的,但是这种顺序是相对的。所以最左匹配原则遇上范围查询就会停止,剩下的字段都无法使用索引。例如a = 1 and b = 2 a,b字段都可以使用索引,因为在a值确定的情况下b是相对有序的,而a>1and b=2,a字段可以匹配上索引,但b值不可以,因为a的值是一个范围,在这个范围中b是无序的。

**最左匹配原则:**最左优先,以最左边的为起点任何连续的索引都能匹配上。同时遇到范围查询(>、<、between、like)就会停止匹配。

假如建立联合索引(a,b,c)

1
2
3
4
5
6
7
create table e(
	a int,
	b int,
	c int
);

alter table e add index idx_e_a_b_c(a,b,c);
  1. 全值匹配查询时

    1
    2
    3
    4
    
    select * from table_name where a = '1' and b = '2' and c = '3' 
    select * from table_name where b = '2' and a = '1' and c = '3' 
    select * from table_name where c = '3' and b = '2' and a = '1' 
    ......
    

    用到了索引

    where子句几个搜索条件顺序调换不影响查询结果,因为Mysql中有查询优化器,会自动优化查询顺序

  2. 匹配左边的列时

    1
    2
    3
    
    select * from table_name where a = '1' 
    select * from table_name where a = '1' and b = '2'  
    select * from table_name where a = '1' and b = '2' and c = '3'
    

    都从最左边开始连续匹配,用到了索引

    1
    2
    3
    
    select * from table_name where  b = '2' 
    select * from table_name where  c = '3'
    select * from table_name where  b = '1' and c = '3'
    

    这些没有从最左边开始,最后查询没有用到索引,用的是全表扫描

    1
    
    select * from table_name where a = '1' and c = '3' 
    

    如果不连续时,只用到了a列的索引,b列和c列都没有用到

  3. 匹配列前缀

    如果列是字符型的话它的比较规则是先比较字符串的第一个字符,第一个字符小的哪个字符串就比较小,如果两个字符串第一个字符相通,那就再比较第二个字符,第二个字符比较小的那个字符串就比较小,依次类推,比较字符串。

    如果a是字符类型,那么前缀匹配用的是索引,后缀和中缀只能全表扫描了

    1
    2
    3
    
    select * from table_name where a like 'As%'; //前缀都是排好序的,走索引查询
    select * from table_name where  a like '%As'//全表查询
    select * from table_name where  a like '%As%'//全表查询
    
  4. 匹配范围值

    1
    
    select * from table_name where  a > 1 and a < 3
    

    可以对最左边的列进行范围查询

    1
    
    select * from table_name where  a > 1 and a < 3 and b > 1;
    

    多个列同时进行范围查找时,只有对索引最左边的那个列进行范围查找才用到B+树索引,也就是只有a用到索引,在1<a<3的范围内b是无序的,不能用索引,找到1<a<3的记录后,只能根据条件 b > 1继续逐条过滤

  5. 精确匹配某一列并范围匹配另外一列

    如果左边的列是精确查找的,右边的列可以进行范围查找

    1
    
    select * from table_name where  a = 1 and b > 3;
    

    a=1的情况下b是有序的,进行范围查找走的是联合索引

  6. 排序

    一般情况下,我们只能把记录加载到内存中,再用一些排序算法,比如快速排序,归并排序等在内存中对这些记录进行排序,有时候查询的结果集太大不能在内存中进行排序的话,还可能暂时借助磁盘空间存放中间结果,排序操作完成后再把排好序的结果返回客户端。Mysql中把这种再内存中或磁盘上进行排序的方式统称为文件排序。文件排序非常慢,但如果order子句用到了索引列,就有可能省去文件排序的步骤

    1
    
    select * from table_name order by a,b,c limit 10;
    

    因为b+树索引本身就是按照上述规则排序的,所以可以直接从索引中提取数据,然后进行回表操作取出该索引中不包含的列就好了

    order by的子句后面的顺序也必须按照索引列的顺序给出,比如

    1
    
    select * from table_name order by b,c,a limit 10;
    

    这种颠倒顺序的没有用到索引

    1
    2
    
    select * from table_name order by a limit 10;
    select * from table_name order by a,b limit 10;
    

    这种用到部分索引

    1
    
    select * from table_name where a =1 order by b,c limit 10;
    

    联合索引左边列为常量,后边的列排序可以用到索引

  7. 分组

    1
    
    select b from e where a > 1 GROUP BY b;
    

    group by 同 order,group by 必会发生排序,这样是为什么group by后面的列一定要出现在select list中。