B-Tree与B+Tree基本概念
为什么在数据库中不使用时间复杂度为O(logN)的二叉查找树,是因为磁盘IO的问题,数据库索引是放在磁盘上的,数据量特别大时,索引也变得很大,不可能把所有的索引都放到内存当中,只能逐一加载每一个磁盘页。而在最坏情况下,磁盘IO次数对应着索引树的高度,所以为了减少磁盘IO次数,需要把树的高度减小。
B-Tree
B-Tree性质
阶为M的B-树拥有以下的性质:
- 树的根或者是一片树叶,或者其孩子数在2和M之间
- 除根以外,所有的非叶节点的孩子数在 ⌈M/2⌉和M之间
- 所有的叶节点都在相同的深度上
- 每个节点存放至少M/2 - 1(上取整)和至多M - 1 个关键字(至少2个关键字)
- 非叶节点的关键字个数=孩子指针个数 - 1
- 节点内关键字有序
B-Tree实现
查看github
B+Tree
B+树与B树的差别在于:
- 非叶节点的孩子指针与关键字个数相同
- 所有关键字都在叶子节点的链表中出现(稠密索引),并且链表中的关键字是有序的
- 为所有叶子节点增加一个链指针
- 关键字都出现在叶子节点
- 不可能在非叶子节点命中
- 非叶子节点相当于叶子节点的索引(稀疏索引),叶子节点相当于是存储关键字的数据层
B+Tree实现
查看github