Mysql中的B-Tree索引的底层结构以及使用原则和特性

发布时间:2021-07-12 15:10:15 作者:chen
来源:亿速云 阅读:336

这篇文章主要介绍“Mysql中的B-Tree索引的底层结构以及使用原则和特性”,在日常操作中,相信很多人在Mysql中的B-Tree索引的底层结构以及使用原则和特性问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Mysql中的B-Tree索引的底层结构以及使用原则和特性”的疑惑有所帮助!接下来,请跟着小编一起来学习吧!

    MySQL是目前业界最为流行的关系型数据库之一,而索引的优化也是数据库性能优化的关键之一。所以,充分地了解MySQL索引有助于提升开发人员对MySQL数据库的使用优化能力。

    MySQL的索引有很多种类型,可以为不同的场景提供更好的性能。而B-Tree索引是最为常见的MySQL索引类型,一般谈论MySQL索引时,如果没有特别说明,就是指B-Tree索引。本文就详细讲解一下B-Tree索引的底层结构,使用原则和特性。

    为了节约你的时间,本文的主要内容如下:

B-Tree索引

    B-Tree索引使用B-Tree来存储数据,当然不同存储引擎的实现方式不同。B-Tree通常意味着所有的值都是按顺序存储的,并且每一个叶子页到根的距离相同,下图展示了B-Tree索引的抽象表示,由此可以看出MySQL的B-Tree索引的大致工作机制。

    B-Tree索引的底层数据结构一般是B+树,其具体数据结构和优势这里就不作详细描述,下图展示了B-树索引的抽象表示,大致反应了MyISAM索引是如何工作的,而InnoDB使用的结构有所不同。

Mysql中的B-Tree索引的底层结构以及使用原则和特性

    MySQL可以在单独一列上添加B-Tree索引,也可以在多列数据上添加B-Tree索引,多列的数据按照添加索引声明的顺序组合起来,存储在B-Tree的页中。假设有如下数据表:

Mysql中的B-Tree索引的底层结构以及使用原则和特性

    对于表中的每一行数据,索引中包含了last_name,first_name和birthday列的值,下图展示了该索引是如何组织数据的存储的。

Mysql中的B-Tree索引的底层结构以及使用原则和特性

    B-Tree索引使用B-Tree作为其存储数据的数据结构,其使用的查询规则也由此决定。一般来说,B-Tree索引适用于全键值、键值范围和键前缀查找,其中键前缀查找只适用于根据最左前缀查找。B-Tree索引支持的查询原则如下所示:

    因为索引树的节点是有序的,所以除了按值查找之外,索引还可以用于查询中的ORDER BY操作(按顺序查找),如果ORDER BY子句满足前面列出的几种查询类型,则这个索引也可以满足对应的排序需求。

    下面是一些关于B-Tree索引的限制:

聚簇索引

    聚簇索引并不是一种单独的索引类型,而是一种数据存储方式。具体的细节依赖于其实现方式,但是InnoDB的聚簇索引实际上在同一个结构中保存了B-Tree索引和数据行。

    当表有聚簇索引时,它的数据行实际上存放在索引的叶子页中,这也就是说数据行和相邻的键值紧凑地存储在一起。

    下图展示了聚簇索引中的记录是如何存放的。注意到,叶子页包含了行的全部数据行,但是节点页只包含了索引列。

Mysql中的B-Tree索引的底层结构以及使用原则和特性

    聚簇索引可能对性能有帮助,但也可能导致严重的性能问题。聚簇的数据是有一些重要的优点:

    如果在设计表和查询时能充分利用上面的优点,那么就能极大地提升性能。同时,聚簇索引也有一些缺点:

InnoDB和MyISAM的索引区别

    聚簇索引和非聚簇索引的数据分布有区别,以及对应的主键索引和二级索引的数据分布也有区别,通常会让人感到困惑和意外。下图展示了MyISAM和InnoDB的不同索引和数据存储方式。

    MyISAM的数据分布非常简单,按照数据插入的顺序存储在磁盘上,主键索引和二级索引的叶节点存储着指针,指向对应的数据行。

 InnoDB中,聚簇索引“就是”表,所以不会像MyISAM那样需要独立的行存储。聚簇索引的每个叶节点都包含了主键值和所有的剩余列(在此例中是col2)。

    InnoDB的二级索引和聚簇索引很不同。InnoDB二级索引的叶节点中存储的不是“行指针”,而是主键值,并以此作为指向行的“指针”。

Mysql中的B-Tree索引的底层结构以及使用原则和特性

松散索引扫描

    MySQL并不支持松散索引扫描,也就是无法按照不连续的方式扫描一个索引。通常,MySQL的索引扫描需要先定义一个起点和终点,即使需要的数据只是这段索引中很少数的几个,MySQL仍然需要扫描这段索引中的每个条目。

    下面,我们通过一个示例说明这点,假设我们有如下索引(a,b),有下面的查询:

Mysql中的B-Tree索引的底层结构以及使用原则和特性

    因为索引的前导字段是列a,但是在查询中只指定了字段b,MySQL无法使用这个索引,从而只能通过全表扫描找到匹配的行,如下图所示。

Mysql中的B-Tree索引的底层结构以及使用原则和特性

    了解索引的物理结构的话,不难发现还可以有一个更快的办法执行上面的查询。索引的物理结构(不是存储引擎的API)是的可以先扫描a列第一个值对应的b列的范围,然后再跳到a列第二个不不同值扫描对应的b列的范围。下图展示了如果由MySQL来实现这个过程会怎样。

Mysql中的B-Tree索引的底层结构以及使用原则和特性

    注意到,这时就无须再使用WHERE子句过滤,因为松散索引扫描已经跳过了所有不需要的记录。

    MySQL 5.0之后的版本,在某些特殊的场景下是可以使用松散索引扫描的,例如,在一个分组查询中需要找到分组的最大值和最小值:

Mysql中的B-Tree索引的底层结构以及使用原则和特性

    在EXPLAIN中的Extra字段显示"Using index for group-by",表示这里将使用松散索引扫描。

覆盖索引

    索引除了是一种查找数据的高效方式之外,也是一种列数据的直接获取方式。MySQL可以使用索引来直接获取列的数据,这样就不需要读取数据行。如果一个索引包含所有需要查询的字段的值,我们就称之为“覆盖索引”。

    覆盖索引是非常有用的工具,能够极大地提高性能。SQL查询只需要扫描索引而无需回表,会带来很多好处:

    当发起一个被覆盖索引的查询(也叫索引覆盖查询)时,在EXPLAIN的Extra列可以看到"Using Index"的信息。例如,表sakila.inventory有一个多列索引(store_id, film_id)。MySQL如果只需要访问这两列,就可以使用这个索引做覆盖索引,如下所示:

Mysql中的B-Tree索引的底层结构以及使用原则和特性

到此,关于“Mysql中的B-Tree索引的底层结构以及使用原则和特性”的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注亿速云网站,小编会继续努力为大家带来更多实用的文章!

推荐阅读:
  1. PostgreSQL的B-tree索引
  2. mysql中怎么实现索引最左原则

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

mysql

上一篇:CentOS 7中怎么部署一个RabbitMQ服务

下一篇:CentOS与Ubuntu的区别是什么

相关阅读

您好,登录后才能下订单哦!

密码登录
登录注册
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》