mysql聚簇索引的页分裂原理实例分析

2022-10-16,,,,

本文实例讲述了mysql聚簇索引的页分裂。分享给大家供大家参考,具体如下:

在mysql中,myisam采用的是非聚簇索引的,innodb存储引擎是采用聚簇索引的。

聚簇结构的特点:

  • 根据主键查询条目时,不用回行(数据就在主键节点下)
  • 如果碰到不规则数据插入时,造成频繁的页分裂

为什么会产生页分裂?

这是因为聚簇索引采用的是平衡二叉树算法,而且每个节点都保存了该主键所对应行的数据,假设插入数据的主键是自增长的,那么根据二叉树算法会很快的把该数据添加到某个节点下,而其他的节点不用动;但是如果插入的是不规则的数据,那么每次插入都会改变二叉树之前的数据状态。从而导致了页分裂。

测试:

创建2张表

create table t8(
id int primary key,
c1 varchar(500),
c2 varchar(500),
c3 varchar(500),
c4 varchar(500),
c5 varchar(500),
c6 varchar(500)
) engine innodb charset utf8;
create table t9(
id int primary key,
c1 varchar(500),
c2 varchar(500),
c3 varchar(500),
c4 varchar(500),
c5 varchar(500),
c6 varchar(500)
) engine innodb charset utf8;

写一个php脚本,用于插入1w条无规则的主键数据和1w条规则的主键数据,来看看区别。

<?php
set_time_limit(0);
$conn = mysql_connect('localhost','root','1234');
mysql_query('use test;');
//自增长主键
$str = str_repeat('a', 500);
$starttime = microtime(true);
for($i=1;$i<=10000;$i++){
  mysql_query("insert into t8 values($i,'$str','$str','$str','$str','$str','$str')");
}
$endtime = microtime(true);
echo $endtime-$starttime.'<br/>';
//无序的主键
$arr = range(1, 10000);
shuffle($arr);
$starttime = microtime(true);
foreach($arr as $i){
  mysql_query("insert into t9 values($i,'$str','$str','$str','$str','$str','$str')");
}
$endtime = microtime(true);
echo $endtime-$starttime.'<br/>';

测试结果图

1w条规则的数据:998秒 = 16分钟
1w条不规则的数据:1939秒 = 32分钟

结论:

聚簇索引的主键值,应尽量是连续增长的值,而不是要是随机值, (不要用随机字符串或uuid),否则会造成大量的页分裂与页移动。在使用innodb的时候最好定义成:

id int unsigned primary key auto_increment

《mysql聚簇索引的页分裂原理实例分析.doc》

下载本文的Word格式文档,以方便收藏与打印。