Redis 概念以及底层数据结构

Redis 简介

REmote DIctionary Server(Redis) 是一个由SalvatoreSanfilippo写的key-value存储系统。

Redis是一个开源的使用ANSI C语言编写、遵守BSD协议、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库,并提供多种语言的API。

它通常被称为数据结构服务器,因为值(value)可以是字符串(String), 哈希(Map), 列表(list), 集合(sets) 和有序集合(sorted sets)等类型。

Redis特点

Redis 是完全开源免费的,遵守BSD协议,是一个高性能的key-value数据库。

Redis 与其他 key – value 缓存产品有以下三个特点:

Redis支持数据的持久化,可以将内存中的数据保持在磁盘中,重启的时候可以再次加载进行使用。

Redis不仅仅支持简单的key-value类型的数据,同时还提供list,set,zset,hash等数据结构的存储。

Redis支持数据的备份,即master-slave模式的数据备份。

Redis 优势

性能极高 – Redis能读的速度是110000次/s,写的速度是81000次/s 。

丰富的数据类型 – Redis支持 Strings, Lists, Hashes, Sets 及 Ordered Sets 数据类型操作。

原子 – Redis的所有操作都是原子性的,同时Redis还支持对几个操作全并后的原子性执行。

丰富的特性 – Redis 还支持 publish/subscribe, 队列,key 过期等等特性。

Redis对象类型简介

  • Redis是一种key/value型数据库,其中,每个key和value都是使用对象表示的。
    比如,我们执行以下代码:
redis> SET message "hello redis"  

其中的key是message,是一个包含了字符串”message”的对象。而value是一个包含了”hello redis”的对象。
Redis共有五种对象的类型,分别是:类型常量对象的名称REDIS_STRING字符串对象REDIS_LIST列表对象REDIS_HASH哈希对象REDIS_SET集合对象REDIS_ZSET有序集合对象Redis中的一个对象的结构体表示如下:“`typedef struct redisObject {

// 类型  
unsigned type:4;          

// 编码方式  
unsigned encoding: 4;  

// 引用计数  
int refcount;  

// 指向对象的值  
void *ptr;  

} robj;

type表示了该对象的对象类型,即上面五个中的一个。但为了提高存储效率与程序执行效率,每种对象的底层数据结构实现都可能不止一种。encoding就表示了对象底层所使用的编码。

- Redis对象底层数据结构

编码常量| 编码所对应的底层数据结构
---| --- 
REDIS_ENCODING_INT| long 类型的整数
REDIS_ENCODING_EMBSTR| embstr 编码的简单动态字符串
REDIS_ENCODING_RAW| 简单动态字符串
REDIS_ENCODING_HT| 字典
REDIS_ENCODING_LINKEDLIST| 双端链表 
REDIS_ENCODING_ZIPLIST| 压缩列表
REDIS_ENCODING_INTSET| 整数集合
REDIS_ENCODING_SKIPLIST| 跳跃表和字典

- 字符串对象

字符串对象的编码可以是int、raw或者embstr
如果一个字符串的内容可以转换为long,那么该字符串就会被转换成为long类型,对象的ptr就会指向该long,并且对象类型也用int类型表示。
普通的字符串有两种,embstr和raw。embstr应该是Redis 3.0新增的数据结构,在2.8中是没有的。如果字符串对象的长度小于39字节,就用embstr对象。否则用传统的raw对象。

#define REDIS_ENCODING_EMBSTR_SIZE_LIMIT 44
robj *createStringObject(char *ptr, size_t len) {
   if (len <= REDIS_ENCODING_EMBSTR_SIZE_LIMIT)
       return createEmbeddedStringObject(ptr,len);
   else
       return createRawStringObject(ptr,len);
}

embstr的好处有如下几点:
1. embstr的创建只需分配一次内存,而raw为两次(一次为[`sds`](https://github.com/antirez/redis/blob/unstable/src/sds.h)分配对象,另一次为objet分配对象,embstr省去了名列前茅次)。
1. 相对地,释放内存的次数也由两次变为一次。
1. embstr的objet和sds放在一起,更好地利用缓存带来的优势。

raw和embstr的区别可以用下面两幅图所示:



![图-1.png](https://wt-box.worktile.com/public/db936e4c-844f-47f5-8c90-9c1c901b383c)


![图-2.png](https://wt-box.worktile.com/public/493f6e5b-e1ef-4943-a47f-35f574e5fee6)


- 列表对象
列表对象的编码可以是ziplist或者linkedlist
1. ziplist是一种压缩链表,它的好处是更能节省内存空间,因为它所存储的内容都是在连续的内存区域当中的。当列表对象元素不大,每个元素也不大的时候,就采用ziplist存储但当数据量过大时就ziplist就不是那么好用了。因为为了保证他存储内容在内存中的连续性,插入的复杂度是O(N),即每次插入都会重新进行realloc。如下图所示,对象结构中ptr所指向的就是一个ziplist整个ziplist只需要malloc一次,它们在内存中是一块连续的区域。


![图-3.png](https://wt-box.worktile.com/public/fa5419e6-b374-44a1-9af3-9a387c595d82)



2. linkedlist是一种双向链表。它的结构比较简单,节点中存放pre和next两个指针,还有节点相关的信息。当每增加一个node的时候,就需要重新malloc一块内存。



![图-4.png](https://wt-box.worktile.com/public/aca6bdb6-6557-466f-b0d6-b7c53fbae051)


- 哈希对象
哈希对象的底层实现可以是ziplist或者hashtable。
ziplist中的哈希对象是按照key1,value1,key2,value2这样的顺序存放来存储的。当对象数目不多且内容不大时,这种方式效率是很高的。

hashtable的是由dict这个结构来实现的, dict是一个字典,其中的指针dicht ht[2] 指向了两个哈希表

typedef struct dict {
   dictType type;
   void *privdata;
   dictht ht[2];
   long rehashidx; / rehashing not in progress if rehashidx == -1 /
   int iterators; / number of iterators currently running /
} dict;
typedef struct dictht {
   dictEntry *table;
   unsigned long size;
   unsigned long sizemask;
   unsigned long used;
} dictht;

dicht[0] 是用于真正存放数据,dicht[1]一般在哈希表元素过多进行rehash的时候用于中转数据。
dictht中的table用语真正存放元素了,每个key/value对用一个dictEntry表示,放在dictEntry数组中。


![图-5.png](https://wt-box.worktile.com/public/76fb0cf2-b867-4c8c-8d16-484248842abb)


- 集合对象
集合对象的编码可以是intset或者hashtable
intset是一个整数集合,里面存的为某种同一类型的整数,支持如下三种长度的整数:

#define INTSET_ENC_INT16 (sizeof(int16_t))
#define INTSET_ENC_INT32 (sizeof(int32_t))
#define INTSET_ENC_INT64 (sizeof(int64_t))

intset是一个有序集合,查找元素的复杂度为O(logN),但插入时不一定为O(logN),因为有可能涉及到升级操作。比如当集合里全是int16_t型的整数,这时要插入一个int32_t,那么为了维持集合中数据类型的一致,那么所有的数据都会被转换成int32_t类型,涉及到内存的重新分配,这时插入的复杂度就为O(N)了。
intset不支持降级操作。

- 有序集合对象
有序集合的编码可能两种,一种是ziplist,另一种是skiplist与dict的结合。
ziplist作为集合和作为哈希对象是一样的,member和score顺序存放。按照score从小到大顺序排列
skiplist是一种跳跃表,它实现了有序集合中的快速查找,在大多数情况下它的速度都可以和平衡树差不多。但它的实现比较简单,可以作为平衡树的替代品。它的结构比较特殊。下面分别是跳跃表skiplist和它内部的节点skiplistNode的结构体:

/*

  • 跳跃表
  • /
    typedef struct zskiplist {
     // 头节点,尾节点
     struct zskiplistNode header, *tail;
     // 节点数量
     unsigned long length;
     // 目前表内节点的最大层数
     int level;
    } zskiplist;
    / ZSETs use a specialized version of Skiplists /
    /
  • 跳跃表节点
  • /
    typedef struct zskiplistNode {
     // member 对象
     robj *obj;
     // 分值
     double score;
     // 后退指针
     struct zskiplistNode *backward;
     // 层
     struct zskiplistLevel {
  // 前进指针  
  struct zskiplistNode *forward;  
  // 这个层跨越的节点数量  
  unsigned int span;  

} level[];
} zskiplistNode;

head和tail分别指向头节点和尾节点,然后每个skiplistNode里面的结构又是分层的(即level数组)
用图表示,大概是下面这个样子:

图-6.png

总结

以上简单介绍了Redis的简介,特性以及五种对象类型和五种对象类型的底层实现。事实上,Redis的高效性和灵活性正是得益于同一个对象类型采用不同的底层结构,并且在必要的时候对二者进行转换,还有就是各种底层结构对内存的合理利用。

作者:龚林杰  Worktile高级工程师
转载请注明出处。

文章标题:Redis 概念以及底层数据结构,发布者:刘佳,转载请注明出处:https://worktile.com/kb/p/6508

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
刘佳刘佳认证作者
上一篇 2022年3月20日 上午1:15
下一篇 2022年3月20日 上午1:20

相关推荐

  • oa打卡定位

    标题:解决OA打卡定位问题的策略与技术 摘要:企业员工打卡管理是保证工作纪律和效率的重要环节。1、确保精确性和公正性的定位技术至关重要。2、优化通讯协议和数据保护是提升系统稳定性和安全性的关键。3、增强用户界面设计和体验可以大大提升员工对OA系统的接受度。针对确保精确性和公正性的定位技术,可以运用G…

    2024年1月16日
    31600
  • 研发效能和软件安全性如何平衡

    本文探讨的主体是研发效能与软件安全性的平衡问题。核心观点涉及研发流程的优化、自动化工具的利用、敏捷和DevSecOps实践、员工培训与文化建设、持续监测与响应机制、合规性与安全标准。在优化研发流程时,需重视将安全作为基本要求整合到产品设计中。自动化工具能够加速发现和修复安全漏洞的过程。敏捷开发和De…

    2023年11月17日
    30900
  • 如何看懂项目报价管理

    项目报价管理是确保项目在预算范围内顺利进行的关键环节。要看懂项目报价管理,关键的几个步骤包括了解项目报价的基本原则、掌握成本估算技术、识别和管理项目风险、以及熟悉合同条款与条件。在这些方面中,了解项目报价的基本原则尤为重要,因为它为其他所有步骤提供了基础。基本原则涉及到如何合理预算、如何评估项目的实…

    2024年4月10日
    8900
  • 项目管理工具应如何支持多项目管理

    摘要:项目管理工具应在功能多样性、1、资源配置优化、2、时间线明晰化以及3、协作沟通强化方面支持多项目管理。数字化工具在资源配置中起着至关重要的作用,能够检测资源的利用情况,预防资源的过度分配。通过一个中心化的界面,管理者能够轻松地分配任务,跟踪多个项目进展及资源耗费,防止重要项目由于资源分配不当而…

    2023年12月21日
    28100
  • 装饰项目如何管理的好一些

    要管理好装饰项目,明确规划、团队协作、跟踪进度、质量控制、成本管理 是关键。其中,明确规划 是基石,为项目的顺利进行提供了方向和目标。具体而言,明确的项目规划应包括对项目范围、时间、预算和质量的全面定义,确保项目沿着既定方向发展,并能够预见和规避风险。 一、项目规划与设计 项目规划与设计是装饰项目管…

    2024年4月11日
    6900
  • 图形化编程与代码编程的区别是什么

    区别在于图形化是代码的封装和模块化,图形化对没有编程知识的人相对友好,然而其局限是功能远劣于代码,只能用于教育和其它一些极少的场景;代码虽然对于没有基础的人相对困难,但其功能灵活多样,是实际中普遍采用的形式。 图形化编程 图形化编程在起初,是为孩子们涉足编程开发的。所以图形块显得卡通一点,不同图形块…

    2023年2月20日
    1.6K00
  • 软件工程什么是devops

    软件开发生命周期中,DevOps是一种文化理念、实践方法与技术栈的集合体,旨在缩短系统开发生命周期,确保持续交付高质量的软件。DevOps关键特点包括:1、持续集成与持续部署(CI/CD)流程的自动化、2、跨功能团队的紧密合作、3、快速反馈机制的整合、4、微服务与容器化技术的广泛应用。 扩展解读CI…

    2024年3月26日
    8100
  • 傲农oa系统

    标题:傲农OA系统的特点与应用 开门见山地说,傲农OA系统是针对现代农业企业管理需求而设计的信息化办公平台,旨在通过技术手段提升管理效率和决策质量。该系统的核心特征包括:1、定制化的解决方案、2、流程自动化管理、3、数据化决策支持、4、云端服务与移动办公相结合、5、系统安全与稳定性强。尤为突出的是其…

    2024年1月12日
    23700
  • 项目经理应该如何管理自己的团队

    项目经理应该通过有效沟通、确立明确目标、分配适合的角色、建立透明机制、提供反馈和激励、持续培训和发展来管理自己的团队。这些策略帮助建立信任、提高团队协作、激发成员潜力、并最终实现项目目标。其中,确立明确目标尤为关键,因为它为团队提供了共同追求的目标和方向。明确目标还有助于团队成员理解自己的角色和责任…

    2024年4月11日
    5500
  • 云原生架构设计的关键原则是什么

    对于云原生架构设计的关键原则,1、去中心化治理、2、自动化运维、3、微服务架构、4、容器化、5、弹性伸缩、6、可观测性是其核心。去中心化治理意味着打破传统架构中大型、单体应用的设计模式,采用分布式系统的思想,使各个服务组件能够独立地开发、部署和扩展。 云原生架构设计关键原则中,自动化运维是其中之一,…

    2023年12月28日
    23400

发表回复

登录后才能评论
注册PingCode 在线客服
站长微信
站长微信
电话联系

400-800-1024

工作日9:30-21:00在线

分享本页
返回顶部