B树详解

article/2025/9/8 23:52:51

B树

B树,一般都被叫做B-树。

定义

  • B树中的每个节点的元素和子树数量是有限的,除了根节点外,所有节点最多拥有M-1个元素,所有非叶子非根节点最多拥有M个子树,即为M阶树。
  • 根节点至少拥有两个子树,除了根节点之后的非叶子节点拥有K个子树以及K-1个元素((M+1)/2<K<M),元素按照递增或递减顺序排列
  • 所有叶子节点属于同一层

B树的查找

因为B树当中一个节点对应的K个子树和它k-1个元素,所有,我们只需要判断查找的key和当前节点的所有元素的大小关系就可以判断数据的范围。
B数的一个节点当中拥有K-1个元素和K个子树,我们用keys和childs来存储,并且我们知道,keys当中的元素是有序的。child中的子树对应keys中元素分割得到的区间。
首先我们查找node.keys当中大于等于key的位置,我们命名为pos。如果pos等于len(node.keys)或者node.keys[pos] != key,说明当前节点不是我们要找的,我们要继续搜索子树。

举个例子:

在这里插入图片描述
比如我们要搜索7,首先我们在根节点当中找到第一个大于等于7的位置,这个位置的元素是9不等于7,说明当前节点当中没有7,我们需要继续往子树递归查找。由于子树对应元素分割出来的区间,所以我们可以确定如果7存在子树当中,只会出现在9前面的子树中,所以我们往9的下标的子树,也就是node.childs[1]的子树方向递归。

B树的插入

和查找相比,B树的插入要复杂一些。
B树的插入有一个原则,那就是所有的插入操作只发生在叶子节点。这点其实很容易想明白,因为如果要插入的key在非叶子节点,那么这就变成了修改操作了,我们直接修改原key对应的value。如果插入的key不在非叶子节点,那么显然我们可以一直查找到叶子节点。
在这里插入图片描述
比如这张图当中,3-9的根节点将整个区间分割成了小于3,3到9和大于9这三个区间。无论我们要插入的key是什么,要么落在区间边界,要么落在某个区间里。落在边界的情况就是key值出现在了非叶子节点的keys当中,我们直接修改它对应的value即可,如果出现在区间里,那么显然应该在叶子节点当中添加一个值。
但是往叶子节点当中添加数据有一个小问题,那就是B树对于所有节点当中元素的数量是有限制的,不允许无限添加。所以我们需要对节点中元素超过数量的情况做处理。
B树针对这个问题的解决方案非常巧妙,它的措施很简单,用一句话概括就是通过分裂节点来实现减少节点当中元素的数量
有一个问题是我们分裂了节点之后,父节点当中的元素也应该增加才对,因为父节点的子树数量是和节点中元素的数量对应的。子节点分裂导致分支增加,那么显然父节点也应该增加一个元素才对。
的确如此,也是因为这个原因,所以叶子节点分裂之后,需要上传一个元素到父节点当中,来保证父节点中元素数量和子树数量保持合法。我们来看下面这个例子:

在这里插入图片描述

这是一个4阶的B树,我们先插入5,这时候中间叶子节点的元素数量达到3,这时还没有违反性质。我们再插入6:
在这里插入图片描述
这时叶子节点在连续插入两个元素之后数量大于等于M,那么我们需要将它一分为二,将中间节点上传给父节点。于是经过这个调整之后,父节点当中增加了一个元素,也增加了一个分支,保证了B树继续合法。
最后得到的结果如下:
在这里插入图片描述
但是你可能会问,那父节点当中上传了一个元素也可能导致父节点中元素数量超标啊,对于这个问题该怎么办呢?其实很简单,和你想的一样,我们继续分裂节点。
来看下面这个例子:
在这里插入图片描述
我们往其中插入13,会导致最后一个叶子节点数量超标,于是我们分裂节点,将中间元素11上传到父节点:

但是由于上传父节点也可能引起元素数量超标,所以我们要向上递归判断是否需要分裂节点的操作。此时父节点当中元素数量大于等于M,需要继续分裂:
在这里插入图片描述
分裂产生新生成的节点由于高度更高,代替了原本的根节点,成为了新的根节点。并且原来根节点的子树也发生了拆分,分别分配给新根节点的两个子树。也就是说我们在拆分节点的时候,除了要拆分keys之外,也需要拆分childs,并且将这些childs重新assign父指针。
在这里插入图片描述

B树的删除

所有删除的都是叶子节点

首先,我们来理清楚第一个要点。无论我们当前删除的元素是什么,最终都会落实在叶子节点上,也就是说所有的情况都可以转化成删除叶子节点的问题。
我知道这听起来很荒谬,因为很有可能我们要删除的元素并不在叶子节点,而在中间的某棵子树的根节点,怎么能说都能变成叶子节点的删除呢?
做到这点并不难,只需要我们做一个很简单的转化。
我们举个例子,在下面这张图中,假如我们要删除元素11,而11在根节点上,显然我们要删除的位置并不在叶子节点。
在这里插入图片描述
但是为了避免删除非叶子节点的元素,我们可以先找到11的后继节点。这里的后继节点指的是在这棵树上,比当前元素大的最小的节点。在这个图当中,11的后继节点是12,我们将12赋值给11,递归往下调用,转变成删除12,如图2:
在这里插入图片描述
当然,我们选出来的后继节点仍然可能并不是叶子节点,这没有关系,我们只需要重复执行以上操作即可。因为我们可以保证后继节点出现的位置在树上的深度只会比当前元素更大,不会更小。而树深是有限的,也就是说最多经过有限次转化,我们就可以把删除操作转嫁到叶子节点身上。
这一点是后续所有推导的前提,我们必须要搞清楚。

后继节点的求法

求后继节点是二叉搜索树当中非常常规的做法,思路本身很朴素,就是找到比某个key值大的最小的节点。

但是在树形节点上做这个操作会多一点步骤,没有二分法那么直观。对于一个节点来说,如果当前节点没有元素大于key,那么只有一种可能:后继节点在最右侧的子树上。因为最右侧的子树大于节点中所有的元素,所以可能出现比key大的值。
举个例子:
在这里插入图片描述
比如我们要求11的后继,对于根节点而言没有元素大于11,那么如果这个后继存在,必然在最右侧的子树当中。如果我们要求的是15的后继,那么显然即使我们搜索了最右侧的子树,也找不到合法的后继。
如果当前节点存在大于key的元素,那么有两种可能,一种可能是后继出现在子树上,还有一种可能是后继就在这个节点当中。
还是上面的图,如果我们要找10的后继,我们在根节点当中找到了比10大的11,但是我们此时还没有搜索子树,所以没有办法判断最后的答案是11还是子树当中有更优的解。
所以为了解决这个问题,我们需要将11这个元素作为备胎,传递给子树。如果子树找到了更优的解,那么就返回最优解,否则说明备胎就是最优解,那么就返回备胎。
删除之后的两种情况

在理解了这个问题之后,我们就可以愉快地讨论节点上删除元素的情况了。
之前我们说过了,一棵合法的B树,它叶子节点上的元素应该是K-1个,其中M//2 <= K <= M。
由于B树存在最少节点数的限制,所以伴随着我们删除元素,很有可能打破这个限制。针对这一情况,我们进行分别讨论。
假设叶子节点当中元素数量很多,我们删除一个仍然可以保证它是合法的。这种情况很简单,没什么好说的,直接删除即可。

详情参考下图:

在这里插入图片描述

在上图当中,M=4,也就是说我们最多允许一个节点出现4个分支,一个节点最少拥有4/2 - 1,也就是一个元素。
假如我们要删除的元素是19,由于节点3当中元素众多,即使删除掉一个元素,依然符合节点的要求,那么就不做任何操作。但如果我们删除的是10,由于节点10只有一个元素,如果删除了,那么就会破坏节点的最小元素数量的限制。

在这种情况下,只有一个办法,就是先删除,再和其他节点借。

和兄弟节点借
我们首先考虑和节点的兄弟节点借一个元素,这个思路很朴素。因为兄弟节点和当前节点的父亲节点相同,可以很方便地转移节点并保证树的性质。
显然对于一个叶子节点来说,它的兄弟节点最多只有两个,也就是它左侧的兄弟和右侧的兄弟。由于B树上的元素存在从左往右的递增性,我们认为右侧的是哥哥节点,左侧的是弟弟节点。其实借的顺序虽然会影响树的形状,但是并不会影响树的合法性。所以我们先和哥哥借再和弟弟借,或者是反过来都行。我个人是设置的先哥哥后弟弟的顺序。

还用之前的例子举例:

在这里插入图片描述
在上图当中,M=4,也就是说我们最多允许一个节点出现4个分支,一个节点最少拥有4/2 - 1,也就是一个元素。
假如我们要删除的元素是19,由于节点3当中元素众多,即使删除掉一个元素,依然符合节点的要求,那么就不做任何操作。但如果我们删除的是10,由于节点10只有一个元素,如果删除了,那么就会破坏节点的最小元素数量的限制。
在这种情况下,只有一个办法,就是先删除,再和其他节点借。

我们首先考虑和节点的兄弟节点借一个元素,这个思路很朴素。因为兄弟节点和当前节点的父亲节点相同,可以很方便地转移节点并保证树的性质。

显然对于一个叶子节点来说,它的兄弟节点最多只有两个,也就是它左侧的兄弟和右侧的兄弟。由于B树上的元素存在从左往右的递增性,我们认为右侧的是哥哥节点,左侧的是弟弟节点。其实借的顺序虽然会影响树的形状,但是并不会影响树的合法性。所以我们先和哥哥借再和弟弟借,或者是反过来都行。我个人是设置的先哥哥后弟弟的顺序。

还用之前的例子举例:
在这里插入图片描述
假设我们要删除节点10,节点10只有一个元素,删除了必然破坏合法性。这个时候我们先看下哥哥的情况,哥哥节点当中有3个元素,即使借走一个仍然可以满足要求,那么我们就和哥哥借。

借的方法很简单,由于哥哥节点当中所有的元素都大于当前节点,所以显然为了保证元素顺序,我们会借第一个元素,也就是13。但是13是大于父节点中的12的,所以我们不能直接把13塞到原来10的位置,而需要先将父节点的12挪下来,放到10的位置,再将13填到12的位置上去。如果你熟悉平衡树的话,你会发现这其实是一个左旋操作,如果你不熟悉的话,也不用纠结。

最后达到平衡态的样子如下:

在这里插入图片描述
同理,如果我们要删除的是23,由于它没有哥哥节点,只有弟弟节点,并且弟弟节点满足条件。那么我们就和弟弟节点借一个元素,逻辑和上面一样。我们先从父节点要一个元素下来,再从弟弟节点借一个元素放回父节点。得到的结果如下:
在这里插入图片描述
同理,如果我们要删除的是23,由于它没有哥哥节点,只有弟弟节点,并且弟弟节点满足条件。那么我们就和弟弟节点借一个元素,逻辑和上面一样。我们先从父节点要一个元素下来,再从弟弟节点借一个元素放回父节点。得到的结果如下:

在这里插入图片描述

兄弟节点也是穷光蛋

既然存在兄弟节点可以借那么显然也会存在兄弟节点借不了的情况,如果兄弟节点自身也是勉强达到条件,显然是借不了的。这种时候没办法,只能还是和父亲节点要。如果父亲节点稍稍富裕,给出了一个元素之后还是能满足条件,那么就从父亲节点出。但是这里需要注意,父亲节点给出去了一个元素,那么它的子树数量也应该随之减少,不然也会不满足B树的特性。为了达成这一点,可以通过合并两个子树来实现。

我们来看个例子,会更直观一些,比如在下图当中,我们继续删除10:
在这里插入图片描述
删除之后,会得到:
在这里插入图片描述
你会发现这个图很奇怪,除了比较丑之外,最大的问题就是它的根节点有两个元素,但是却有四颗子树,这显然违反了B树的性质。

违反性质的原因是因为原本属于根节点的元素9被子树借走了,所以为了解决这个问题,我们需要将邻近的两棵子树合并。也就是将[6, 7]和[9]子树合并,得到:

在这里插入图片描述
稍微想一下会发现这其实是添加节点时分裂的逆操作,所以从本质上来说我们添加元素时分裂节点输送一个元素进入父节点和删除的时候从父亲节点借走一个,然后合并两个子树是互为逆操作,本质是一回事。

到这里,我们还有最后一个问题没解决,当我们跟父节点借合并子树时同样会导致父节点中的元素数量减少,万一父节点减少了一个元素之后也不满足条件应该怎么办?你可能会觉得是不是跟子节点借?其实想一下就会知道这不可行。原因也很简单,因为即使我们能找到富裕的子节点,但是也没办法让子树的数量随着也增加1。

解决这个问题的方法也不难,我们只需要递归借节点的操作,让父节点去和它的兄弟以及父节点借元素就好了。在极端情况下,这很有可能导致树的高度发生变化,比如:

在这里插入图片描述
上图是一个阶数为5的B树,如果我们删除7,根据刚才的惯例,我们会跟父亲节点借元素6,并且和[1, 3]子树合并,得到:

在这里插入图片描述
但是这一借会导致父节点破坏了B树的最低元素要求,所以我们需要递归维护父节点。也就是让父节点去重复借元素的步骤,我们可以发现对于节点[10]来说,它没有富裕的兄弟节点,只能继续和父节点借,这一借会再一次导致合并的发生,最终我们得到的结果如下:

在这里插入图片描述
我们观察一下上面树结构的变化,可以发现只要是和父亲节点借元素,必然伴随着和兄弟节点合并的情况。而和兄弟节点合并,除了需要维护两个节点当中的元素之外,还需要维护各自的子树。尤其是如果我们在每个节点当中记录父亲节点以及在父亲节点当中的位置的话,这些都需要维护。这也是B树实现比理解困难的原因。

另外,删除和添加元素时都有可能引起根节点的变化,所以我们还需要做好判断,在更新树结构的同时更新根节点。

转载于:https://mp.weixin.qq.com/s?__biz=MzUyNjQxNjYyMg==&mid=2247487737&idx=2&sn=7931571c4647c709cd07fbcbaa3d6f32&chksm=fa0e7f78cd79f66e331b35437185bb890f6e2f039aeed41d8d823749b5812e5d6b9247d09266&scene=21#wechat_redirect


http://chatgpt.dhexx.cn/article/6iwquIld.shtml

相关文章

MySQL索引底层实现原理(B树和B+树)

文章目录 一、B-树索引1. 理论部分2. B树黄色的data表示key索引所在的这一行的数据&#xff0c;data存储的是数据本身内容&#xff0c;还是数据在磁盘上的地址&#xff1f;关于操作系统从磁盘读取索引文件到内存中的几个问题B树的缺点 三、B树B树特点MySQL最终为什么要采用B树存…

B树概念和插入实现

目录 前言 一.B树概念 1.1 概念和性质 1.2 分裂 二.插入的实现 三.性能分析 四.B树的删除 五.B树的优化B树和B*树 5.1 B树 5.2 B*树 六.B树的应用 6.1 MyISAM中的索引 6.2 Innodb引擎 前言 之前我们学了有很多数据结构&#xff0c;比如顺序表&#xff0c;链表&#xff0c;…

MySQL索引(B树、B+树)

目录 简介索引结构&#xff08;树&#xff09;为什么用树&#xff0c;而不用哈希表BTree索引BTree索引聚簇索引与非聚簇索引 索引分类性能分析索引创建场景 简介 MySQL官方对索引的定义为&#xff1a;索引&#xff08;Index&#xff09;是帮助MySQL高效获取数据的数据结构。可…

MySQL B+树相对于B树的区别及优势:

部分参考&#xff1a;B树和B树的区别 MySQL为什么使用树结构&#xff1f; 文件很大&#xff0c;不可能全部存储在内存中&#xff0c;故要存储到磁盘上索引的结构组织要尽量减少查找过程中磁盘I/O的存取次数&#xff08;为什么使用B-/Tree&#xff0c;还跟磁盘存取原理有关&am…

B树索引

B-Tree索引是最常见的索引结构&#xff0c;如oracle和mongodb的索引都是B-Tree&#xff0c;而mysql的索引类型是BTree 一、B树索引的结构 B-树索引是基于二叉树结构的。B-树索引结构有3个基本组成部分&#xff1a;根节点、分支节点和叶子节点。其中根节点位于索引结构的最顶端…

什么是B树

1.什么是B树 B树又称为多路平衡查找树&#xff0c;B树中所有结点的孩子节点数的最大值称为B树的阶&#xff0c;通常用m表示。 2.B树的特性 一颗m阶B树或为空树&#xff0c;或为满足如下特性的m叉树&#xff1a; 1&#xff09;树中每个结点至多有M棵子树&#xff08;即至多含有…

图解B树构建过程

1.B树结构同时满足以下特性 每个节点最多包含n个孩子&#xff0c;即n叉树&#xff1b;除了根节点和叶子节点外&#xff0c;每个节点至少有ceil(n/2)个孩子&#xff08;ceil是向上取整&#xff09;&#xff1b;若根节点不是叶子节点&#xff0c;则至少有两个孩子&#xff1b;所…

了解B树的删除

文章目录 1. 删除操作第一种情况第二种情况第三种情况 2. C示例3. 删除复杂度参考文档 在本教程中&#xff0c;您将学习如何从B树中删除键。此外&#xff0c;您还可以找到C语言的示例。     删除B树上的元素包括三个主要事件&#xff1a;搜索要删除的键所在的节点、删除键和…

B树的插入、删除操作

一、简介 B树是什么&#xff1f; 1970年&#xff0c;R.Bayer和E.mccreight提出了一种适用于外查找的树&#xff0c;它是一种平衡的多叉树&#xff0c;称为B树&#xff08;或B-树、B_树&#xff09;。 一棵m阶B树(balanced tree of order m)是一棵平衡的m路搜索树。它或者是空树…

数据结构-B树删除示例

数据结构学习-B树删除示例 1、B树简介2、在线可视化生成B树工具3、B树删除规则4、B树删除示例4.1、删除非根结点示例4.2、删除根结点示例 1、B树简介 1970年&#xff0c;R.Bayer和E.mccreight提出了一种适用于外查找的树&#xff0c;它是一种平衡的多叉树&#xff0c;称为B树&a…

B树-多路平衡查找树

B树 B树一个m阶B树的具有的特征&#xff08;或必须满足的条件&#xff09;B树的查找B树插入元素(一定是在叶子节点插入)1.插入后&#xff0c;没有破坏B树的规则2.插入后&#xff0c;叶子节点元素超过m-1个 B树删除元素1.删除叶子节点上的元素&#xff0c;没有破坏规则2.删除叶子…

B树、B+树详解

B-树&#xff0c;即为B树。因为B树的原英文名称为B-tree&#xff0c;目前理解B的意思为平衡。 概念 首先&#xff0c;B树不要和二叉树混淆&#xff0c;在计算机科学中&#xff0c;B树是一种自平衡树数据结构&#xff0c;它维护有序数据并允许以对数时间进行搜索&#xff0c;顺…

【B树及B树的基本操作】

文章目录 1.B树的定义和特性2.B树的性质3.B树创建的过程。4.B树的删除5.总结 1.B树的定义和特性 B树是一种平衡的多路查找树。 一棵m阶的B树&#xff08;B树中所有结点的孩子个数的最大值为m)&#xff0c;或为空树&#xff0c;或为满足下列特性的m叉树&#xff1a; (1) 树中每…

B树和B+树的区别

文章目录 简述写在前面1、B树2、B树 深入浅出B树B树深入B-树的查找 B 树B树概述 B-树和B树的区别拓展&#xff1a;MySQL为什么使用B-Tree&#xff08;BTree&#xff09;&& 存储知识存储数据最小单元主存存取原理磁盘存取原理 总结 简述 写在前面 大家在面试的时候&am…

B树(B-树)详解

B-树&#xff0c;即为B树。因为B树的原英文名称为B-tree&#xff0c;而国内很多人喜欢把B-tree译作B-树&#xff0c;B-tree就是指的B树。 B-树容易让人误解,建议大家用B树称呼, 本文以下直称B树 这篇介绍概念, 优点应用等, B树的描述和增删改查请到隔壁我写的另一篇(篇幅较长…

数据结构 —— B树

文章目录 1、B树的定义1.1、B树的特性1.2、B树的高度1.3、性能分析1.4、B树的补充说明1.5 、B树、B-树 、B-tree、B tree的区别 2、B树的插入操作以5阶B树为例&#xff0c;介绍B树的插入操作&#xff0c; 3、 B树的删除操作以5阶B树为例&#xff0c;介绍B树的删除操作 4、B树相…

B树和B+树详解

B树、B树看这一篇就够了 [TOC](B树、B树看这一篇就够了) 引言B树什么是B树以及B树是怎么来的B树的基本性质B树的新增和删除B树的插入B树的删除 B树什么是B树以及为什么要有B树B树的基本性质B树的查找 B树与B树的比较B树的优势B树的优势两者的细节对比 B树与B树在实际代码中的应…

B-树(B树)详解

https://www.jianshu.com/p/7dedb7ebe033 具体讲解之前&#xff0c;有一点&#xff0c;再次强调下&#xff1a;B-树&#xff0c;即为B树。因为B树的原英文名称为B-tree&#xff0c;而国内很多人喜欢把B-tree译作B-树&#xff0c;其实&#xff0c;这是个非常不好的直译&#xf…

B树和B+树

目录 一、BST树到AVL树到B树的简介 1.1 BST树 --- 二叉排序树 1.2 AVL树 --- 平衡二叉树 1.3 B树 --- 平衡多路查找树 1.3.1 B树的查找结点过程 1.3.2 B树的添加结点过程&#xff08;和结点分裂过程&#xff09; 1.3.3 B树的删除结点过程 二、B树 2.1 B树和B树 一…

在群晖NAS部署_开源在线项目任务管理工具【dooTask】

一、dooTask简介 1.1、说明 Dootask 是一款由国人开源的轻量级在线项目任务管理工具&#xff0c;它提供各类文档协作工具、在线思维导图、在线流程图、项目管理、任务分发、即时通讯IM&#xff0c;文件管理等功能。基于PHP与Vue编写&#xff0c;遵守AGPL3.0开源协议。 1.2、特…