当前位置:Gxlcms > 数据库问题 > 【Mysql】InnoDB 引擎中的页目录

【Mysql】InnoDB 引擎中的页目录

时间:2021-07-01 10:21:17 帮助过:23人阅读

一、页目录和槽

接上一篇,现在知道记录在页中按照主键大小顺序串成了单链表。

那么我使用主键查询的时候,最顺其自然的办法肯定是从第一条记录,也就是 Infrimum 记录开始,一直向后找,只要存在总会找到。这种在数据量少的时候还好说,一旦数据多了,遍历耗时一定非常长。

于是,作者又想到了一个好办法,灵感来自于书本中的目录。我们翻书的时候想查找一些内容,就会去查看目录,然后直接确定好内容所在的页码。

那么对于 InnoDB 来说,过程如下:

  • 将所有正常的记录划分为几个组,这里包括那 2 条虚拟记录,但是不包含已经被移除到垃圾链表的记录。
  • 每个组内最后一条记录(也就是最大的那条)就是“大哥”,其他记录都是“小弟”,而“大哥”记录的头信息中的 n_owned 属性表示该组内共有几条记录。
  • 将每个组中最后一条记录在页面中的地址偏移量单独提取出来,按顺序存储到靠近页尾部的地方。

这个地方就是页目录 Page Directory。而上述的地址偏移量就是该记录的真实数据与页面中第 0 个字节之间的距离,这些地址偏移量被称为

每个槽占用 2 字节,页目录就是由多个槽组成

二、页目录的规定

在上一篇中,创建的表里存在 4 条数据,那么在页中还要算上 Infimum 和 Supremum,共 6 条记录。

这时候 InnoDB 会把它们分出 2 个组:

  • 第一组:只有一个 Infimum 记录
  • 第二组:剩下的 5 条记录

每个槽中,存放着每个组里最大的那条记录所在页面中的地址偏移量。

技术图片

从图中,需要关注页目录的一些点:

  • 页目录有 2 个槽,说明记录被分为 2 个组。
  • Infimum 记录的 n_owned 属性值为 1,而 Supremum 的为 5。

为什么这 6 条记录要这样分?因为作者对于每组中的记录数量有规定

  • 对于 Infimum 所在的分组只能有 1 条记录。
  • Supremum 所在的分组只能在 1~8 条之间。
  • 剩下的分组,记录条数范围只能是 4~8 之间。

三、页目录查找记录的过程

现在继续向测试表里插入 12 条数据,也就是说在页中共有 18 条记录。

然后这些记录就被分成了 5 个组,这里参考书籍上的示意图(只保留一些关键属性):

技术图片

现在,要查找主键是 6 的记录,要如何进行?

因为 5 个槽的编号分别为 0、1、2、3、4 挨着的,并且里面的主键值也都是从小到大进行排序的,可以使用二分法(不清楚的可以百度),那么初始情况下 low=0,high=4:

  1. 计算中间槽的位置,(0+4)/ 2=2,于是查看槽 2 对应记录的主键值为 8,因为 8 > 6,所以 high = 2,low 不变。
  2. 重新计算中间槽位置,(0+2)/ 2=1,于是查看槽 1 对应记录的主键为4,因为 4 < 6,所以 high 不变,low = 1。
  3. 因为 high - low = 1,所以确定主键值为6 的记录就在槽 2 对应的组中。接着找到该组中主键最小的记录,沿着单链表向后遍历,最终找到主键 6 的记录。

这里有个问题,槽对应的值都是这个组的主键最大的记录,如何找到组里最小的记录?比如槽 2 对应最大主键是 8 的记录,那如何找到最小记录。

解决办法是:

  • 通过槽 2 找到 槽 1 对应的记录,也就是主键为 4 的记录。
  • 主键为 4 的记录的下一条记录就是槽 2 当中主键最小的记录,可以找到主键 5。

总结
在一个数据页中查找指定主键值的记录,过程分为 2 步:

  1. 通过二分法确定该记录所在分组对应的槽,然后找到该槽所在分组中主键值最小的记录。
  2. 通过记录的 next_record 属性比那里该槽所在组的各个记录,最终找到目标记录。



本文参考书籍: 小孩子4919 《mysql是怎样运行的》

【Mysql】InnoDB 引擎中的页目录

标签:mysq   示意图   提取   编号   src   mys   目录   主键   strong   

人气教程排行