红黑树和b树的区别:1、结构不同;2、效率不同;3、策略不同;4、应用场景不同;5、维护平衡性手段不同。结构不同是指,红黑树是一种二叉搜索树,每个节点最多只能包含两个子节点,而B树是一种多路搜索树,它的每个节点可以包含多个键值和子节点。
一、红黑树和b树的区别
1、结构不同
红黑树:红黑树是一种二叉搜索树,每个节点最多只能包含两个子节点。
b树:B树是一种多路搜索树,它的每个节点可以包含多个键值和子节点。
2、效率不同
红黑树:对于查找较少数据的情况下,红黑树的常数操作次数更小,效率优于B树。
b树:B树相比红黑树因为其每个节点可以存储多个键值,所以在查找大量数据时,B树的磁盘读取次数通常比红黑树要少。
3、策略不同
红黑树:红黑树属于内排序,内排序是被排序的数据元素全部存放在计算机内存中的排序算法。
b树:b树属于外排序,外排序是指数据存放在外存中,数据排序时涉及内、外存数据交换的排序方法。
4、应用场景不同
红黑树:红黑树更适用于实现集合和映射等数据结构,以及其它查找频繁的场景。
b树:B树更适用于实现数据库索引等需要频繁插入和删除操作的场景。
5、维护平衡性手段不同
红黑树:红黑树通过每个节点要么是红色要么是黑色,并且满足一定的红黑规则来保持平衡。
b树:B树则是维护节点的高度平衡,通过节点的平衡因子来判断平衡状态。
二、红黑树简介
红黑树作为自平衡二叉树的经典,是计算机科学领域中很基础也重要的数据结构,在1972年由Rodolf Bayer教授发明,又在1978年命名为“红黑树”,其作为一种自平衡的二叉树,通过每次插入和删除的自旋方式保证树的平衡态,从而获得稳定且较高的查询性能,并且,因其独特的旋转规则,红黑树比传统的AVL自平衡二叉树效率更高,通过牺牲掉非严格的平衡(即所有节点的左右子树高度差不超过1)来换取更少且稳定的旋转,任何一次插入或删除导致的不平衡在3次旋转/调整内变可以完成。应用十分广泛,不管是Linux进程管理和内存管理,设备驱动和内存跟踪,具体的应用还例如 TreeMap 和 TreeSet,JDK8之后的Hashmap链表长度大于8时转变为红黑树。
红黑树的特征:
- 每个节点或者是黑色,或者是红色。
- 根节点是黑色。
- 每个叶子节点是黑色。
- 如果一个节点是红色的,则它的子节点必须是黑色的。
- 从一个节点到该节点的子孙节点的所有路径上包含相同数目的黑节点。
三、b树简介
在计算机科学中,B树(英语:B-tree)是一种自平衡的树,能够保持数据有序。这种数据结构能够让查找数据、顺序访问、插入数据及删除的动作,都在对数时间内完成。B树,概括来说是一个一般化的二叉查找树(binary search tree),可以拥有多于2个子节点。与自平衡二叉查找树不同,B树为系统大块数据的读写操作做了优化。B树减少定位记录时所经历的中间过程,从而加快存取速度。B树这种数据结构可以用来描述外部存储。这种数据结构常被应用在数据库和文件系统的实现上。
B树同样作为一种自平衡的树,却与红黑树结构上本质不同,即可以为多叉树。受到二叉查找树的启发,但又受限于超大数据量时仍无法避免的较大的树高,B树能够允许每个节点有更多的子节点,定义为阶。这样的定义规则,对于一个n阶B树,允许了每个节点至多有n个子节点,并且每个有m个子节点的节点存有m-1个关键字。与平衡二叉树相比越多的分叉变越降低树的深度。不同于红黑树的自旋调整,B树有自己的插入规则,寻找该插入数据合适的插入位置插入,如果没有足够的位置则进行分裂,即将一般的关键字元素分裂到新的相邻节点中。
B树的出现是基于高效率的磁盘读写而衍生出的多叉平衡搜索树,相比于二叉树每个节点1个关键字的信息,无异于对磁盘的IO是一次巨大的浪费。B树的结构不仅更好的利用每一次的磁盘IO数据,同时也在树的深度上优于二叉树。具体的案例比如MongoDB就选择了B树作为索引,在每个节点即存储数据又存储索引,搜索时相当于二分查找。又因为MongoDB是文档形nosql,基于json格式进行数据存储,对于B树的每个节点都有对应的Data域,只要找到存在节点中的索引就可以直接访问,无疑B树是最优选择。
B树的特点:
- 所有非叶子结点至多拥有两个儿子(Left和Right);
- 所有结点存储一个关键字;
- 非叶子结点的左指针指向小于其关键字的子树,右指针指向大于其关键字的子树。
延伸阅读
红黑树的自平衡策略
平衡策略可以简单概括为三种: 左旋转 、 右旋转 ,以及 变色 。在插入或删除结点之后,只要我们沿着结点到根的路径上执行这三种操作,就可以最终让树重新满足定义。红黑树的主要难点在于插入和删除过程中的自平衡调整。
文章标题:红黑树和b树的区别在哪,发布者:Z, ZLW,转载请注明出处:https://worktile.com/kb/p/49408