mysql使用b+树的原因_b+树索引和hash索引

mysql使用b+树的原因_b+树索引和hash索引https://www.jianshu.com/p/7ce804f97967 众所周知,MySQL的索引使用了B+树的数据结构。那么为什么不用B树呢? 先看一下B树和B+树的区别。 1.B树 维基百科

MySQL用B+树(而不是B树)做索引的原因

 

https://www.jianshu.com/p/7ce804f97967

众所周知,MySQL的索引使用了B+树的数据结构。那么为什么不用B树呢?
先看一下B树和B+树的区别。

1.B树

维基百科对B树的定义为“在计算机科学中,B树(B-tree)是一种树状数据结构,它能够存储数据、对其进行排序并允许以O(log n)的时间复杂度运行进行查找、顺序读取、插入和删除的数据结构。B树,概括来说是一个节点可以拥有多于2个子节点的二叉查找树。与自平衡二叉查找树不同,B-树为系统最优化大块数据的读和写操作。B-tree算法减少定位记录时所经历的中间过程,从而加快存取速度。普遍运用在数据库和文件系统。”

B 树可以看作是对2-3查找树的一种扩展,即他允许每个节点有M-1个子节点。

1.1定义

  • 根节点至少有两个子节点
  • 每个节点有M-1个key,并且以升序排列
  • 位于M-1和M key的子节点的值位于M-1 和M key对应的Value之间
  • 其它节点至少有M/2个子节点
    下图是一个M=4 阶的B树:

     
    mysql使用b+树的原因_b+树索引和hash索引

    M=4的B树

    可以看到B树是2-3树的一种扩展,他允许一个节点有多于2个的元素。

B树的插入及平衡化操作和2-3树很相似,这里就不介绍了。下面是往B树中依次插入
6 10 4 14 5 11 15 3 2 12 1 7 8 8 6 3 6 21 5 15 15 6 32 23 45 65 7 8 6 5 4 的演示动画:

 
mysql使用b+树的原因_b+树索引和hash索引

btreebuild

2.B+树

B+树是对B树的一种变形树,它与B树的差异在于:

  • 有k个子结点的结点必然有k个关键码。
  • 非叶结点仅具有索引作用,跟记录有关的信息均存放在叶结点中。
  • 树的所有叶结点构成一个有序链表,可以按照关键码排序的次序遍历全部记录。
    如下图是一个B+树:

     
    mysql使用b+树的原因_b+树索引和hash索引

    M=4的B+树

    下图是B+树的建立过程:

     
    mysql使用b+树的原因_b+树索引和hash索引

    Bplustreebuild.gif

B+树和B树的区别

B+树的非叶子结点只包含导航信息,不包含实际的值,所有的叶子结点和相连的节点使用链表相连,便于区间查找和遍历。
B+ 树的优点在于:

  • IO次数更少:由于B+树在内部节点上不包含数据信息,因此在内存页中能够存放更多的key。 数据存放的更加紧密,具有更好的空间局部性。因此访问叶子节点上关联的数据也具有更好的缓存命中率。
  • 遍历更加方便:B+树的叶子结点都是相链的,因此对整棵树的遍历只需要一次线性遍历叶子结点即可。而且由于数据顺序排列并且相连,所以便于区间查找和搜索。而B树则需要进行每一层的递归遍历。相邻的元素可能在内存中不相邻,所以缓存命中性没有B+树好。

但是B树也有优点,其优点在于,由于B树的每一个节点都包含key和value,因此经常访问的元素可能离根节点更近,因此访问也更迅速。下面是B 树和B+树的区别图:

 
mysql使用b+树的原因_b+树索引和hash索引

B树和B+树的区别图

为什么MySQL选择B+树做索引

1、 B+树的磁盘读写代价更低:B+树的内部节点并没有指向关键字具体信息的指针,因此其内部节点相对B树更小,如果把所有同一内部节点的关键字存放在同一盘块中,那么盘块所能容纳的关键字数量也越多,一次性读入内存的需要查找的关键字也就越多,相对IO读写次数就降低了。

2、B+树的查询效率更加稳定:由于非终结点并不是最终指向文件内容的结点,而只是叶子结点中关键字的索引。所以任何关键字的查找必须走一条从根结点到叶子结点的路。所有关键字查询的路径长度相同,导致每一个数据的查询效率相当。

3、B+树更便于遍历:由于B+树的数据都存储在叶子结点中,分支结点均为索引,方便扫库,只需要扫一遍叶子结点即可,但是B树因为其分支结点同样存储着数据,我们要找到具体的数据,需要进行一次中序遍历按序来扫,所以B+树更加适合在区间查询的情况,所以通常B+树用于数据库索引。

4、B+树更适合基于范围的查询:B树在提高了IO性能的同时并没有解决元素遍历的我效率低下的问题,正是为了解决这个问题,B+树应用而生。B+树只需要去遍历叶子节点就可以实现整棵树的遍历。而且在数据库中基于范围的查询是非常频繁的,而B树不支持这样的操作或者说效率太低。

参考

作者:Jarkata

链接:https://www.jianshu.com/p/7ce804f97967

来源:简书

著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
转载请注明出处: https://daima100.com/8800.html

(0)
上一篇 2023-02-21
下一篇 2023-02-21

相关推荐

  • 华为认证高斯数据库_华为libra数据库

    华为认证高斯数据库_华为libra数据库摘要:在KV数据库领域,“强一致性”不仅是一个技术名词,它更是业务与运维的重要需求。 本文分享自华为云社区《华为云PB级数据库GaussDB(for Redis)揭秘第七期:高斯Redis与强一致》…

    2023-04-11
    163
  • Python中类变量和实例变量的区别

    Python中类变量和实例变量的区别 在Python中,类及其实例拥有变量,这些变量都可以用来存储对象的状态。但是,类变量和实例变量在定义、作用范围和存储方式上存在显著差异。了解这些差异对于编写Python程序和设计Python类非常重要。在本文中,我们将深入研究Python中类变量和实例变量的区别,并讨论如何在Python类中正确地使用它们。

    2024-05-25
    59
  • 简单python逆向分词(python分词函数)

    简单python逆向分词(python分词函数)中文分词,即 Chinese Word Segmentation,即将一个汉字序列进行切分,得到一个个单独的词。表面上看,分词其实就是那么回事,但分词效果好不好对信息检索、实验结果还是有很大影响的,同时分词的背后其实是涉及各种各样的算法的。

    2023-10-31
    141
  • Python迭代器:高效遍历数据结构

    Python迭代器:高效遍历数据结构Python是一门非常受欢迎的编程语言,其简洁、易读的代码特性让很多开发者喜欢上了这门语言。在Python中,迭代器是一个非常重要的概念,它是一种高效遍历数据结构的方式,使得开发者可以在代码中使用更简单和更易读的方式处理数据。本文将对Python迭代器做详细的阐述,解释它的原理,如何创建迭代器以及在实际开发中如何使用迭代器。

    2023-12-19
    104
  • MySql的回顾一:基础[亲测有效]

    MySql的回顾一:基础[亲测有效]周末的时光是短暂,也是轻松愉快的,在这炎炎的夏日坐在小板凳上,吹着空调喝着茶的我带你点轻轻的点开我的文章链接,带领屏幕前的你回顾一下MySql的内容,希望你能有所收获。本篇随笔分上下两部分,上半部分理

    2023-03-20
    141
  • Python items()方法:解析字典数据,获取键值对

    Python items()方法:解析字典数据,获取键值对codeitems()/code方法是字典类型中的内置函数之一,常用于遍历字典,解析字典数据,获取字典中的键值对。该方法返回一个可迭代的字典视图对象,其中每个元素是一个包含键和值的元组,这个元组可以接收两个参数并对键值进行操作。

    2023-12-22
    132
  • mysql的join语句_while语句条件

    mysql的join语句_while语句条件今天我们来看一下join语句的执行流程 JOIN主要使用 Index Nested-Loop Join 和 Block Nested-Loop Join 算法实现 Index Nested-Loop…

    2023-01-28
    143
  • MySQL深入学习-

    MySQL深入学习-B+树索引的正确使用 索引并不是越多越好,索引创建越多,MySQL维护的代价越高,如果SQL未能完全使用到索引,创建索引的意义是不大的。 适用条件 表x,创建索引a,b,c。主键y。 全值匹配 sel

    2023-05-18
    153

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注