如何从数据存储角度分析Redis为何这么快

发布时间：2021-11-29 14:32:56 作者：柒染
来源：亿速云阅读：190

# 如何从数据存储角度分析Redis为何这么快

## 引言

Redis作为当今最流行的内存数据库之一，其卓越的性能表现一直备受开发者关注。官方基准测试显示，单节点Redis可达到10万次/秒的OPS（每秒操作数），在理想环境下甚至能突破100万次/秒。这样的性能表现远超传统关系型数据库，其核心优势很大程度上源于它在数据存储层面的精心设计。

本文将从数据存储架构的五个关键维度——**内存存储机制**、**高效数据结构**、**持久化策略**、**存储优化技巧**和**集群架构**，深入解析Redis的"快"是如何在存储层面实现的。通过分析底层存储原理，我们不仅能理解Redis的性能奥秘，还能掌握优化Redis存储的最佳实践。

## 一、内存存储：速度的根基

### 1.1 内存与磁盘的访问速度差异

Redis选择内存作为主要存储介质并非偶然。从物理特性来看：
- 内存访问延迟约100纳秒（SSD约100微秒，机械磁盘约10毫秒）
- 内存带宽可达数十GB/s（SSD通常不超过5GB/s）
- 内存支持随机访问无性能惩罚（磁盘随机访问性能急剧下降）

```python
# 存储介质延迟对比示例
latency = {
    "L1 Cache": 0.5,    # ns
    "L2 Cache": 7,      
    "RAM": 100,        
    "SSD": 100000,     
    "HDD": 10000000    
}

1.2 Redis内存管理机制

1.2.1 定制化内存分配器

Redis采用jemalloc作为默认内存分配器（也可配置为tcmalloc），相比glibc的malloc： - 减少内存碎片率（可控制在1.2以下） - 多线程场景下分配效率提升30%+ - 支持内存页的精细化管理

通过INFO memory命令可观察内存分配情况：

# Memory
used_memory: 1000000
used_memory_human: 976.56K
mem_fragmentation_ratio: 1.20
mem_allocator: jemalloc-5.1.0

1.2.2 对象共享与引用计数

Redis使用引用计数管理对象生命周期，对于常见小整数（0-9999）等值会进行对象共享：

// redisObject结构体定义
typedef struct redisObject {
    unsigned type:4;        // 数据类型（4位）
    unsigned encoding:4;    // 编码方式（4位）
    unsigned lru:LRU_BITS;  // LRU时间（24位）
    int refcount;           // 引用计数（32位）
    void *ptr;             // 数据指针（64位系统为8字节）
} robj;

1.2.3 内存回收策略

Redis提供多种内存淘汰策略（通过maxmemory-policy配置）： - volatile-lru：仅对设置过期时间的key进行LRU淘汰 - allkeys-lru：所有key参与LRU淘汰 - volatile-ttl：优先淘汰剩余存活时间短的key - noeviction：不淘汰，写入操作直接报错

二、高效数据结构：速度的引擎

2.1 Redis的底层数据结构体系

Redis对外提供String、List、Hash等数据类型，底层实际采用更高效的数据结构实现：

数据类型	可能编码方式（底层实现）
String	int/embstr/raw
List	ziplist/linkedlist/quicklist
Hash	ziplist/hashtable
Set	intset/hashtable
Zset	ziplist/skiplist+hashtable

2.2 典型数据结构分析

2.2.1 SDS（Simple Dynamic String）

传统C字符串的改进版本：

struct sdshdr {
    int len;        // 已使用空间
    int free;       // 剩余空间
    char buf[];     // 字节数组
};

优势： - O(1)时间复杂度获取字符串长度 - 杜绝缓冲区溢出 - 减少内存重分配次数（空间预分配+惰性释放）

2.2.2 压缩列表（Ziplist）

特殊编码的连续内存结构，适合小数据存储：

<zlbytes> <zltail> <zllen> <entry> <entry> ... <entry> <zlend>

特点： - 每个entry包含前一个entry的长度（实现反向遍历） - 内容连续存储，CPU缓存命中率高 - 自动选择合适编码（int/short string等）

2.2.3 快速列表（Quicklist）

List类型的现代实现，结合了ziplist和linkedlist的优点：

quicklist -> [quicklistNode] <-> [quicklistNode] <-> ...
            ↓                    ↓
          ziplist             ziplist

通过list-max-ziplist-size参数控制单个ziplist大小（默认-2即8KB）

2.3 数据结构的自动转换

Redis会根据数据规模自动切换编码方式：

# Hash类型示例
127.0.0.1:6379> hset small-hash field1 value1
(integer) 1
127.0.0.1:6379> object encoding small-hash
"ziplist"

# 当字段数超过hash-max-ziplist-entries（默认512）
# 或值超过hash-max-ziplist-value（默认64字节）时
127.0.0.1:6379> hset large-hash field1 "非常长的值..."... 
(integer) 1
127.0.0.1:6379> object encoding large-hash
"hashtable"

三、持久化策略：速度与安全的平衡

3.1 RDB持久化

3.1.1 工作原理

定时生成内存快照（二进制格式）
采用COW（Copy-On-Write）技术减少阻塞
通过save/bgsave指令触发

配置示例：

save 900 1      # 900秒内至少1次修改
save 300 10     # 300秒内至少10次修改
save 60 10000   # 60秒内至少10000次修改

3.1.2 性能优势

二进制紧凑格式，加载速度快（比AOF快数倍）
子进程方式持久化，主进程几乎无阻塞
适合大规模数据备份与灾难恢复

3.2 AOF持久化

3.2.1 工作流程

将写命令追加到aof_buf缓冲区
根据策略（appendfsync）刷盘：
- always：每个命令都同步
- everysec：每秒同步（默认）
- no：由操作系统决定

3.2.2 重写机制

通过bgrewriteaof命令触发，生成精简的AOF文件：

原始AOF：
SET counter 1
INCR counter
INCR counter
INCR counter

重写后：
SET counter 4

3.3 混合持久化（Redis 4.0+）

结合RDB和AOF的优势：

[RDB头部][AOF尾部]

配置方式：

aof-use-rdb-preamble yes

四、存储优化技巧：极致的性能追求

4.1 小数据存储优化

4.1.1 使用ziplist编码

适当调整以下参数可提升小数据存储效率：

list-max-ziplist-size -2       # 默认8KB
hash-max-ziplist-entries 512   # 哈希字段数阈值
hash-max-ziplist-value 64      # 哈希值大小阈值
set-max-intset-entries 512     # 整数集合元素数阈值

4.1.2 避免大Key

大Key的危害： - 阻塞请求处理（单线程模型） - 网络传输延迟增加 - 内存分配不稳定

检测方法：

redis-cli --bigkeys

4.2 内存优化策略

4.2.1 使用Hash分片

将大Hash拆分为多个小Hash：

def shard_key(key, total_shards):
    return f"{key}:{hash(key) % total_shards}"

4.2.2 对象压缩

对于大文本值，客户端可先压缩再存储：

import zlib
compressed = zlib.compress(b"large text...")
redis.set("compressed_key", compressed)

4.3 过期策略优化

Redis采用惰性删除+定期删除组合策略： 1. 访问时检查过期时间（惰性删除） 2. 每100ms随机检查部分key（ACTIVE_EXPIRE_CYCLE_LOOKUPS_PER_LOOP=20）

优化建议： - 避免在同一时间点设置大量相同TTL的key - 对不频繁访问但需自动过期的key，可启用主动淘汰

五、集群架构：水平扩展的存储方案

5.1 Redis Cluster的数据分片

采用CRC16算法计算slot（共16384个slot）：

slot = CRC16(key) mod 16384

数据迁移时以slot为单位，支持在线重分片。

5.2 主从复制与读写分离

复制流程： 1. 从节点发送PSYNC命令 2. 主节点执行bgsave生成RDB 3. RDB传输完成后，从节点加载数据 4. 主节点持续传播写命令