同一份数据Redis需要存两次法人原因是什么

发布时间:2021-01-25 15:27:47 作者:Leah
来源:亿速云 阅读:124

这篇文章给大家介绍同一份数据Redis需要存两次法人原因是什么,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。

五种基本类型之集合对象

Redis 中的集合对象是一个包含字符串类型元素的无序集合,集合中元素唯一不可重复。

集合对象的底层数据结构有两种:intsethashtable。内部通过编码来进行区分:

编码属性描述object encoding命令返回值
OBJ_ENCODING_INTSET使用整数集合实现的集合对象intset
OBJ_ENCODING_HT使用字典实现的集合对象hashtable

intset 编码

intset(整数集合)可以保存类型为 int16_tint32_tint64_t 的整数值,并且保证集合中没有重复元素。
intset 数据结构定义如下(源码 inset.h 内):

typedef struct intset {
  uint32_t encoding;//编码方式
  uint32_t length;//当前集合中的元素数量
  int8_t contents[];//集合中具体的元素
} intset;

下图就是一个 intset 的集合对象存储简图:

同一份数据Redis需要存两次法人原因是什么

encoding

intset 内部的 encoding 记录了当前整数集合的数据存储类型,主要有三种:

contents[]

contents[] 虽然结构的定义上写的是 int8_t 类型,但是实际存储类型是由上面的 encoding 来决定的。

整数集合的升级

假如一开始整数集合中的元素都是 16 位的,采用 int16_t 类型来存储,此时需要再存储一个 32 位的整数,那么就需要对原先的整数集合进行升级,升级之后才能将 32 位的整数存储到整数集合内。这就涉及到了整数集合的类型升级,升级过程主要有 4 个步骤:

PS:和字符串对象的编码一样,整数集合的类型一旦发生升级,将会保持编码,无法降级。

升级示例

假如我们有一个集合存储的 encodingint16_t,内部存储了 3 个元素:

同一份数据Redis需要存两次法人原因是什么

这时候需要插入一个整数 50000,发现存储不下去,而 50000 是一个 int32_t 类型整数,所以需要申请新空间,申请空间大小为 4 * 32 - 48=80

同一份数据Redis需要存两次法人原因是什么

现在新的数组内要放置 4 个元素,原来的数组排在第 3,所以需要将升级后的 3 移动到 64-95 位。

同一份数据Redis需要存两次法人原因是什么

继续将升级后的 2 移动到 32-63 位。

同一份数据Redis需要存两次法人原因是什么

继续将升级后的 1 移动到 0-31 位。

同一份数据Redis需要存两次法人原因是什么

然后会将 50000 放到 96-127 位。

同一份数据Redis需要存两次法人原因是什么

最后会修改 encodinglength 属性,修改之后就完成了本次的升级。

hashtable 编码

hashtable 结构在前面讲述哈希对象的时候进行过详细分析,想详细了解的可以点击这里。

intset 和 hashtable 编码转换

当一个集合满足以下两个条件时,Redis 会选择使用 intset 编码:

集合对象常用命令

sadd key member1 member2:将一个或多个元素 member 加入到集合 key 当中,并返回添加成功的数目,如果元素已存在则被忽略。

了解了操作集合对象的常用命令,我们就可以来验证下前面提到的哈希对象的类型和编码了,在测试之前为了防止其他 key 值的干扰,我们先执行 flushall 命令清空 Redis 数据库。

依次执行如下命令:

sadd num 1 2 3 //设置 3 个整数的集合,会使用 intset 编码
type num //查看类型
object encoding num  //查看编码

sadd name 1 2 3 test //设置 3 个整数和 1 个字符串的集合,会使用 hashtable 编码
type name //查看类型
object encoding name //查看编码

得到如下效果:

同一份数据Redis需要存两次法人原因是什么

可以看到,当设置的元素里面只有整数时,集合使用的就是 intset 编码,当设置的元素中含有非整数时,使用的就是 hashtable 编码。

五种基本类型之有序集合对象

Redis 中的有序集合和集合的区别是有序集合中的每个元素都会关联一个 double 类型的分数,然后按照分数从小到大的顺序进行排列。换句话说,有序集合的顺序是由我们自己设值的时候通过分数来确定的。

有序集合对象的底层数据结构有两种:skiplistziplist。内部同样是通过编码来进行区分:


编码属性描述object encoding命令返回值
OBJ_ENCODING_SKIPLIST使用跳跃表实现的有序集合对象skiplist
OBJ_ENCODING_ZIPLIST使用压缩列表实现的有序集合对象ziplist

skiplist 编码

skiplist 即跳跃表,有时候也简称为跳表。使用 skiplist 编码的有序集合对象使用了 zset 结构来作为底层实现,而zset 中同时包含了一个字典和一个跳跃表。

跳跃表

跳跃表是一种有序的数据结构,其主要特点是通过在每个节点中维持多个指向其他节点的指针,从而达到快速访问节点的目的。

大部分情况下,跳跃表的效率可以等同于平衡树,但是跳跃表的实现却远远比平衡树的实现简单,所以 Redis 选择了使用跳跃表来实现有序集合。

下图是一个普通的有序链表,我们如果想要找到 35 这个元素,只能从头开始遍历到尾(链表中元素不支持随机访问,所以不能用二分查找,而数组中可以通过下标随机访问,所以二分查找一般适用于有序数组),时间复杂度是 O(n)

同一份数据Redis需要存两次法人原因是什么

那么假如我们可以直接跳到链表的中间,那就可以节省很多资源了,这就是跳表的原理,如下图所示就是一个跳表的数据结构示例:

同一份数据Redis需要存两次法人原因是什么

上图中 level1level2level3 就是跳表的层级,每一个 level 层级都有一个指向下一个相同 level 层级元素的指针,比如上图我们遍历寻找元素 35 的时候就有三种方案:

skiplist 的存储结构

跳跃表中的每个节点是一个 zskiplistNode 节点(源码 server.h 内):

typedef struct zskiplistNode {
  sds ele;//元素
  double score;//分值
  struct zskiplistNode *backward;//后退指针
  struct zskiplistLevel {//层
    struct zskiplistNode *forward;//前进指针
    unsigned long span;//当前节点到下一个节点的跨度(跨越的节点数)
  } level[];
} zskiplistNode;

level 即跳跃表中的层,其是一个数组,也就是说一个节点的元素可以拥有多个层,即多个指向其他节点的指针,程序可以通过不同层级的指针来选择最快捷的路径提升访问速度。

level 是在每次创建新节点的时候根据幂次定律(power law)随机生成的一个介于 1~32 之间的数字。

每个层都会有一个指向链表尾部方向元素的指针,遍历元素的时候需要使用到前进指针。

跨度记录了两个节点之间的距离,需要注意的是,如果指向了 NULL 的话,则跨度为 0

和前进指针不一样的是后退指针只有一个,所以每次只能后退至前一个节点(上图中没有画出后退指针)。

跳跃表中元素是一个 sds 对象(早期版本使用的是 redisObject 对象),元素必须唯一不能重复。

节点的分值是一个 double 类型的浮点数,跳跃表中会将节点按照分值按照从小到大的顺序排列,不同节点的分值可以重复。

上面介绍的只是跳跃表中的一个节点,多个 zskiplistNode 节点组成了一个 zskiplist 对象:

typedef struct zskiplist {
  struct zskiplistNode *header, *tail;//跳跃表的头节点和尾结点指针
  unsigned long length;//跳跃表的节点数
  int level;//所有节点中最大的层数
} zskiplist;

到这里你可能以为有序集合就是用这个 zskiplist 来实现的,然而实际上 Redis 并没有直接使用 zskiplist 来实现,而是用 zset 对象再次进行了一层包装。

typedef struct zset {
  dict *dict;//字典对象
  zskiplist *zsl;//跳跃表对象
} zset;

所以最终,一个有序集合如果使用了 skiplist 编码,其数据结构如下图所示:

同一份数据Redis需要存两次法人原因是什么

上图中上面一部分中的字典中的 key 就是对应了有序集合中的元素(member),value 就对应了分值(score)。上图中下面一部分中跳跃表整数 1,8,9,12 也是对应了元素(member),最后一排的 double 型数字就是分值(score)。
为什么同时选择使用字典和跳跃表

有序集合直接使用跳跃表或者单独使用字典完全可以独自实现,但是我们想一下,如果单独使用跳跃表来实现,那么虽然可以使用跨度大的指针去遍历元素来找到我们需要的数据,但是其复杂度仍然达到了 O(logN),而字典中获取一个元素的复杂度是 O(1),而如果单独使用字典虽然获取元素很快,但是字典是无序的,所以如果要范围查找就需要对其进行排序,这又是一个耗时的操作,所以 Redis 综合了两种数据结构来最大程度的提升性能,这也是 Redis 设计的精妙之处。

ziplist 编码

压缩列表在列表对象和哈希对象都有使用到,想详细了解的可以点击这里。

ziplist 和 skiplist 编码转换

当有序集合对象同时满足以下两个条件时,会使用 ziplist 编码进行存储:

有序集合对象常用命令

注意这里默认是闭区间,但是可以在 maxmin 的数值前面加上 ( 或者 [ 来控制开闭区间。zrevrangebyscore key max min:返回有序集合中按 score 从大到小排列后在 [min,max] 区间的所有元素。

注意这里默认是闭区间,但是可以在 maxmin 的数值前面加上 ( 或者 [ 来控制开闭区间。

zrank key member:返回有序集合中 member 中元素排名(从小到大),返回的结果从 0 开始计算。

zrevrank key member:返回有序集合中 member 中元素排名(从大到小),返回的结果从 0 开始计算。

zlexcount key min max:返回有序集合中 minmax 之间的 member 数量。

注意这个命令中的 minmax 前面必须加 ( 或者 [ 来控制开闭区间,特殊值 -+ 分别表示负无穷和正无穷。

了解了操作有序集合对象的常用命令,我们就可以来验证下前面提到的哈希对象的类型和编码了,在测试之前为了防止其他 key 值的干扰,我们先执行 flushall 命令清空 Redis 数据库。

在执行命令之前,我们先把配置文件中的参数 zset-max-ziplist-entries 修改为 2,然后重启 Redis 服务。

重启完成之后依次执行如下命令:

zadd name 1 zs 2 lisi //设置 2 个元素会使用 ziplist
type name //查看类型
object encoding name //查看编码 
  
zadd address 1 beijing 2 shanghai 3 guangzhou 4 shenzhen //设置4个元素则会使用 skiplist编码
type address //查看类型
object encoding address //查看编码

得到如下效果:

同一份数据Redis需要存两次法人原因是什么

关于同一份数据Redis需要存两次法人原因是什么就分享到这里了,希望以上内容可以对大家有一定的帮助,可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看到。

推荐阅读:
  1. LoadRunner同一个脚本运行两次结果相差很大的原因
  2. redis这么快的原因是什么

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

redis

上一篇:怎么在maven中利用profile实现多环境配置

下一篇:怎么在Redis数据库中实现一个同步锁

相关阅读

您好,登录后才能下订单哦!

密码登录
登录注册
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》