MySQL 回表,覆盖索引,索引下推

2022-07-13,,,,

回表

在研究mysql二级索引的时候,发现mysql回表这个操作,往下研究了一下

字面意思,找到索引,回到表中找数据

解释一下就是:

先通过索引扫描出数据所在的行,再通过行主键id 取出数据。

举个例子说明:

select * from innodb_user
where age = 18 and user_name like '模糊查%';

假如ageuser_name两个字段是个联合索引,我们通过age=18这个索引找到了二级索引树对应页所在的数据,但是由于user_name是模糊查询,导致了这个字段的索引失效,我们得到了二级索引的这一页中age=18的很多个数据(主键id),我们通过这些主键id回到主键索引树里再查表里的数据,这个操作就是回表。

另外回表的产生也是需要一定条件的,如果一次索引查询就能获得所有的select 记录(也就是联合索引已经包含了你查的字段)就不需要回表,如果select 所需获得列中有其他的非索引列,就会发生回表动作。即基于非主键索引的查询需要多扫描一棵索引树。

另外上面所说的不需要回表,其实还有另一个名词

覆盖索引

就是我们需要查询的数据都在二级索引树中,直接返回这种情况就叫做覆盖索引。

上面提到的联合索引、二级索引树、主键索引树这些名词,如果同学们还没有啥概念,请看我写的这一篇文章,详细介绍了mysql的索引
链接: mysql索引详解及演进过程及面试题延伸

索引下推

索引下推(index condition pushdown )简称icp,在mysql5.6以后的版本上推出,用于优化回表查询;

在不使用icp的情况下,在使用非主键索引(又叫普通索引或者二级索引)进行查询时,存储引擎通过索引检索到数据,然后返回给mysql服务器,服务器然后判断数据是否符合条件 ;

在使用icp的情况下,如果存在某些被索引的列的判断条件时,mysql服务器将这一部分判断条件传递给存储引擎,
然后由存储引擎通过判断索引是否符合mysql服务器传递的条件,只有当索引符合条件时才会将数据检索出来返回给mysql服务器 ;

索引条件下推优化可以减少存储引擎查询基础表的次数,也可以减少mysql服务器从存储引擎接收数据的次数。

举个栗子:

drop table if exists `t_user`;
create table `t_user` (
  `id` bigint not null auto_increment comment '主键',
  `name` varchar(64) not null comment '用户名 ',
  `age` int(8) not null comment '年纪',
	`address` varchar(255) default null comment '地址',
  `is_delete` tinyint not null default '0' comment '是否删除 默认否',
  `create_time` datetime default current_timestamp comment '创建时间',
  primary key (`id`),
  key `idx_name_age` (`name`,`age`)
) engine=innodb default charset=utf8mb4 collate=utf8mb4_0900_ai_ci comment='用户信息表';
-- 初始化数据 
insert into `t_user`(`name`, `age`, `address`) values ('李四', 22, '中国');
insert into `t_user`(`name`, `age`, `address`) values ('李五', 22, '中国');
insert into `t_user`(`name`, `age`, `address`) values ('李六', 23, '中国');
insert into `t_user`(`name`, `age`, `address`) values ('张三', 24, '中国');
insert into `t_user`(`name`, `age`, `address`) values ('李期', 24, '中国');

用上面的语句建一个测试用的表

无索引下推: 查看索引下推的状态

show variables like '%optimizer_switch%';
-------------------------------------------------------
optimizer_switch	index_merge=on,index_merge_union=on,index_merge_sort_union=on,index_merge_intersection=on,engine_condition_pushdown=on,index_condition_pushdown=on,mrr=on,mrr_cost_based=on,block_nested_loop=on,batched_key_access=off,materialization=on,semijoin=on,loosescan=on,firstmatch=on,duplicateweedout=on,subquery_materialization_cost_based=on,use_index_extensions=on,condition_fanout_filter=on,derived_merge=on,use_invisible_indexes=off,skip_scan=on,hash_join=on,subquery_to_derived=off,prefer_ordering_index=on,hypergraph_optimizer=off,derived_condition_pushdown=on

关闭索引下推:

索引下推是mysql 5.6优化查询回表的功能,在5.6之前都不支持索引下推,笔者用的8.0,则需要先关闭索引下推:
set optimizer_switch='index_condition_pushdown=off';

执行sql;

explain select * from t_user where name like '李%' and age = 22;

分析一下以上sql执行的过程:

  • 1. idx_name_age`组合索引 遵循最左匹配遇到非等值判断时匹配停止,name的范围查询则会使age这个条件就不会走索引;
  • 2. 会先在name索引上顺序找到 符合条件的name和id数据;
  • 3. 然后通过id在聚簇索引上回表找到对应的age数据,将结果存放在临时表中;
  • 4. 最后在临时表中通过age条件来筛选数据。

以上过程会扫描4条记录,回表4次。
extra = using where:表示优化器需要通过索引回表查询数据。

有索引下推: 开启索引下推

set optimizer_switch='index_condition_pushdown=on';

执行sql:

explain select * from t_user where name like '李%' and age = 22;

开启索引下推优化后再分析一下以上sql执行的过程:

  • 1. 由于开启了索引下推会在idx_name_age索引上同时检索满足name和age的条件的数据的id;
  • 2. 再用id到聚簇索引上查询完整的数据。

以上过程会扫描4行数据,回表次数是2次。

extra = using index condition 表示索引下推。

总结:

  • 索引下推功能是mysql 5.6推出优化回表的操作,只支持向上兼容,低版本是不支持的;
  • 索引下推优化的只是回表次数,扫描行数还是一样的。

到此这篇关于mysql 回表,覆盖索引,索引下推的文章就介绍到这了,更多相关mysql 回表内容请搜索以前的文章或继续浏览下面的相关文章希望大家以后多多支持!

《MySQL 回表,覆盖索引,索引下推.doc》

下载本文的Word格式文档,以方便收藏与打印。