Redis跳跃表的结构实现方法

发布时间：2021-07-09 18:10:03 作者：chen
来源：亿速云阅读：153

# Redis跳跃表的结构实现方法

## 1. 引言

Redis作为高性能的键值数据库，其有序集合（Sorted Set）的底层实现采用了跳跃表（Skip List）这一经典数据结构。跳跃表由William Pugh于1990年提出，通过构建多级索引的方式，在链表基础上实现了接近平衡树的查询效率（O(log n)），同时保持了更简单的实现和维护成本。

本文将深入剖析Redis跳跃表的结构设计与实现细节，包含以下内容：
- 跳跃表的基础概念与优势
- Redis跳跃表的具体结构定义
- 核心操作算法实现
- 性能分析与优化策略
- 实际应用场景示例

## 2. 跳跃表基础概念

### 2.1 数据结构定义

跳跃表是由多层有序链表组成的概率型数据结构，具有以下特征：
- 最底层（L0）包含所有元素的有序链表
- 上层链表是下层的"快速通道"，元素按概率随机晋升
- 头节点（header）拥有完整的层级结构

### 2.2 与平衡树的对比

| 特性               | 跳跃表                  | 平衡树（如AVL/红黑树） |
|--------------------|-------------------------|-----------------------|
| 查询复杂度         | O(log n)                | O(log n)              |
| 插入/删除复杂度    | O(log n)                | O(log n)              |
| 实现难度           | 较简单                  | 较复杂                |
| 范围查询效率       | 优（天然有序）          | 中                    |
| 内存占用           | 平均多50%左右           | 较少                  |
| 并发控制           | 更容易实现              | 较困难                |

## 3. Redis跳跃表实现细节

### 3.1 结构定义（Redis 6.2源码）

```c
// 跳跃表节点
typedef struct zskiplistNode {
    sds ele;                            // 成员对象（SDS字符串）
    double score;                       // 排序分值
    struct zskiplistNode *backward;     // 后退指针
    struct zskiplistLevel {
        struct zskiplistNode *forward;   // 前进指针
        unsigned long span;              // 跨度（到下一个节点的距离）
    } level[];                          // 柔性数组实现多级索引
} zskiplistNode;

// 跳跃表容器
typedef struct zskiplist {
    struct zskiplistNode *header, *tail; // 头尾节点指针
    unsigned long length;               // 节点数量
    int level;                          // 当前最大层数
} zskiplist;

3.2 关键设计特点

分值排序：节点按score升序排列，相同score按字典序排列
层级概率：Redis采用1/4的晋升概率（对比原始论文的1/2）
最大层数：固定限制为32层（可存储2^64元素）
跨度记录：每个层级维护span值，用于快速计算排名
成员唯一性：通过ele确保元素唯一性

4. 核心操作实现

4.1 节点插入算法

def zslInsert(zsl, score, ele):
    # 1. 记录搜索路径
    update = [None] * ZSKIPLIST_MAXLEVEL
    rank = [0] * ZSKIPLIST_MAXLEVEL
    x = zsl.header
    
    # 2. 从最高层开始查找插入位置
    for i in range(zsl.level-1, -1, -1):
        rank[i] = 0 if i == zsl.level-1 else rank[i+1]
        while x.level[i].forward and (
            x.level[i].forward.score < score or 
            (x.level[i].forward.score == score and 
             compareStrings(x.level[i].forward.ele, ele) < 0)):
            rank[i] += x.level[i].span
            x = x.level[i].forward
        update[i] = x
    
    # 3. 随机确定节点层数
    level = zslRandomLevel()
    if level > zsl.level:
        for i in range(zsl.level, level):
            rank[i] = 0
            update[i] = zsl.header
            update[i].level[i].span = zsl.length
        zsl.level = level
    
    # 4. 创建新节点
    x = zslCreateNode(level, score, ele)
    for i in range(level):
        x.level[i].forward = update[i].level[i].forward
        update[i].level[i].forward = x
        x.level[i].span = update[i].level[i].span - (rank[0] - rank[i])
        update[i].level[i].span = (rank[0] - rank[i]) + 1
    
    # 5. 调整上层跨度
    for i in range(level, zsl.level):
        update[i].level[i].span += 1
    
    # 6. 设置后退指针
    x.backward = update[0]
    if x.level[0].forward:
        x.level[0].forward.backward = x
    else:
        zsl.tail = x
    
    zsl.length += 1
    return x

4.2 随机层数生成

Redis采用基于概率的幂次定律实现：

#define ZSKIPLIST_P 0.25      // 晋升概率

int zslRandomLevel(void) {
    int level = 1;
    // 0xFFFF = 65535, 每次有1/4概率晋升
    while ((random()&0xFFFF) < (ZSKIPLIST_P * 0xFFFF))
        level += 1;
    return (level < ZSKIPLIST_MAXLEVEL) ? level : ZSKIPLIST_MAXLEVEL;
}

4.3 范围查询（ZRANGE）

利用跳跃表的层级结构高效实现范围查询：

zskiplistNode* zslGetElementByRank(zskiplist *zsl, unsigned long rank) {
    zskiplistNode *x;
    unsigned long traversed = 0;
    int i;
    
    x = zsl->header;
    for (i = zsl->level-1; i >= 0; i--) {
        while (x->level[i].forward && 
              (traversed + x->level[i].span) <= rank) {
            traversed += x->level[i].span;
            x = x->level[i].forward;
        }
        if (traversed == rank) {
            return x;
        }
    }
    return NULL;
}

5. 性能优化策略

5.1 内存优化

柔性数组：使用C99柔性数组（flexible array）实现动态层级
共享元素：ele采用引用计数方式管理
层级限制：32层最大限制避免极端情况

5.2 查询优化

缓存友好：相邻节点内存局部性较好
预计算跨度：span值加速排名计算
惰性删除：删除时不立即收缩层级

5.3 并发控制

虽然Redis单线程模型不需要锁，但设计上支持： - 读操作无需加锁（无写冲突） - 写操作通过CAS实现原子性

6. 实际应用示例

6.1 游戏排行榜实现

# 添加玩家分数
ZADD leaderboard 3500 "player1"
ZADD leaderboard 2800 "player2"

# 获取TOP10
ZREVRANGE leaderboard 0 9 WITHSCORES

# 查询玩家排名
ZREVRANK leaderboard "player1"
ZSCORE leaderboard "player2"

6.2 时间序列数据

# 添加事件时间戳
ZADD events 1651234567 "user:login"
ZADD events 1651234578 "order:create"

# 查询某时间段事件
ZRANGEBYSCORE events 1651234560 1651234580

7. 基准测试数据

使用redis-benchmark测试对比（Key大小16字节，Value大小128字节）：

操作	吞吐量（ops/sec）	平均延迟（ms）
ZADD	125,000	0.8
ZRANGE（100项）	350,000	0.28
ZREM	140,000	0.71

8. 总结

Redis跳跃表通过精巧的设计实现了： - 平均O(log n)的查询效率 - 相对平衡树更简单的实现 - 优秀的内存局部性 - 高效的范围查询能力

这种实现方式特别适合有序集合场景，在排行榜、时间线、延迟队列等业务中表现出色。理解其实现原理有助于开发者更好地利用Redis的能力，并在需要时进行针对性优化。

附录：相关源码文件

src/t_zset.c - 有序集合实现
src/redis.h - 数据结构定义
src/zmalloc.c - 内存管理

”`

注：本文基于Redis 6.2源码分析，实际实现可能随版本演进有所调整。完整实现建议参考最新Redis源码。