本文共 1483 字,大约阅读时间需要 4 分钟。
一个Skip List的结构如下图,除了数据域,每个节点还包括1个或多个域用来保存后续节点的位置。
从结构上看,Skip List通过增加层数,节点上可以带有更多的信息,通过这些信息可以直接访问更远的节点(这 也是Skip List精髓所在),就像跳过去一样,所以取名叫Skip List(跳表)。
查询操作很简单,比如我们要找图中节点key为20
的节点。
17
, 很明显20>17
所以应该在后面。继续往后结果是NULL
那说明后面没有要找的节点了。25
且20<25
说明后面也没有我们要找的节点了。Skip List插入
插入操作稍微复杂, 首先我们要找到插入位置,怎么找我们刚才已经描述过了。如下图所示,插入key为10
的节点,插入点应该是节点9
和节点12
之间(紫色的线表示要更新的指向)。然后是插入节点10
,其实就是链表的逐层插入。
这里的需要注意是,逐层插入需要知道节点在每一层的位置,如在level-2中,节点10
前面应该是头结点,而后面应该是节点17
。 因为查询操作得到的只是最后位置,所以通常需要一个临时的空间来记录这些信息。如果节点的高度超过超过了Skip List的最大层数,那么Skip List的层数相应的需要升高。如节点10
的高度是4
的话,根据Skip List的结构特点,那么层数需要提高到level-3。
理想的SkipList结构(如图一)是第一层有所有的节点,第二层只有1/2的节点,且是均匀间隔的,第三 层是1/4的节点,且是均匀间隔的...,那么理想的层数是lgnlgn。
每一次插入一个新节点时,最好的做法就是根据当前表的结构得到一个合适的高度,插入后可以让Skip List的尽量的接近理想的结构,但是实现上这会非常的复杂。
Pugh论文中提出的方法是根据概率随机为新节点生成一个高度,具体的算法如下:
虽然随机生成的高度会打破理想的结构,Pugh在论文中证明,这种结构依然有非常高概率可以使得时间复杂度为Θ(lgn)Θ(lgn)。
通常我们还会约束Skip List的最大层数,公式:maxLevel=log1/pnmaxLevel=log1/pn,其中n表示节点总数。 根据Pugh论文中的结论,p为1/2或者1/4时,整体性能会比较好。(当p=1/2时,确定节点高度有的地方称为抛硬币的方法)。
删除操作跟插入操作类似。
本文转自张昺华-sky博客园博客,原文链接:http://www.cnblogs.com/bonelee/p/6409146.html,如需转载请自行联系原作者