【Redis】深入探索 Redis 的数据类型 —— 无序集合 Set

2023-09-14 22:10:21


一、Set 类型介绍

Set(集合)是 Redis 数据库中的一种数据类型,它是一种无序的、不重复的数据结构,用于存储一组唯一的元素。Set 在 Redis 中非常实用,因为它提供了高效的成员查找和去重功能,常用于处理一些需要存储唯一值的场景。以下是关于 Redis 中 Set 类型的介绍:

特点和用途:

  1. 无序性:Set 中的元素是无序排列的,与元素的插入顺序无关。

  2. 唯一性:Set 中的元素是唯一的,不允许出现重复元素。

  3. 高效的成员查找:Redis 提供了高效的成员查找操作,可以快速判断一个元素是否存在于集合中。

  4. 去重:由于元素的唯一性,Set 常用于去重操作,将一组数据转换为不含重复元素的数据集。

  5. 集合运算:Redis 提供了多个集合运算命令,可以对多个集合进行交集、并集和差集等操作。

  6. 支持多种数据类型:Set 可以存储字符串、数字、甚至其他 Redis 数据类型的元素。

二、Set 类型相关命令

Set(集合)是 Redis 中的一种无序且不重复的数据结构,它包含了一组唯一的成员。以下是与 Set 数据类型相关的常见命令:

2.1 添加元素和检查成员

  1. SADD:将一个或多个成员添加到集合中。

    语法:

    SADD key member [member ...]
    
  2. SMEMBERS:返回集合中的所有成员。

  3. SISMEMBER:检查指定成员是否存在于集合中。

    语法:

    SISMEMBER key member
    
  4. SCARD:获取集合的基数(即成员数量)。

    语法:

    SCARD key
    

2.2 移除元素

  1. SPOP:随机移除并返回集合中的一个成员。

    语法:

    SPOP key [count]
    
  2. SMOVE:将指定成员从一个集合移动到另一个集合。

    语法:

    SMOVE source destination member
    
  3. SREM:从集合中移除一个或多个成员。

    语法:

    SREM key member [member ...]
    

2.3 集合运算

求交集

  1. SINTER:返回多个集合的交集。

    语法:

    SINTER key [key ...]
    
  2. SINTERSTORE:将多个集合的交集存储到一个新集合中。

    语法:

    SINTERSTORE destination key [key ...]
    

求并集

  1. SUNION:返回多个集合的并集。

    语法:

    SUNION key [key ...]
    
  2. SUNIONSTORE:将多个集合的并集存储到一个新集合中。

    语法:

    SUNIONSTORE destination key [key ...]
    

求差集

  1. SDIFF:返回第一个集合与其他集合的差集。

    语法:

    SDIFF key [key ...]
    
  2. SDIFFSTORE:将第一个集合与其他集合的差集存储到一个新集合中。

    语法:

    SDIFFSTORE destination key [key ...]
    

2.4 Set 相关命令总结

以下是与 Set 类型相关的命令的总结,包括命令、作用和时间复杂度:

命令作用时间复杂度
SADD向集合中添加一个或多个成员O(N) (N 为添加成员的数量)
SMEMBERS返回集合中的所有成员O(N) (N 为集合中的元素数量)
SISMEMBER检查成员是否存在于集合中O(1)
SCARD获取集合的基数(成员数量)O(1)
SPOP随机移除并返回集合中的一个成员O(1)
SMOVE将成员从一个集合移动到另一个集合O(1)
SREM从集合中移除一个或多个成员O(N) (N 为移除成员的数量)
SINTER返回多个集合的交集O(N*M) (N 和 M 为集合的大小)
SINTERSTORE将多个集合的交集存储到一个新集合中O(N*M) (N 和 M 为集合的大小)
SUNION返回多个集合的并集O(N+M) (N 和 M 为集合的大小)
SUNIONSTORE将多个集合的并集存储到一个新集合中O(N+M) (N 和 M 为集合的大小)
SDIFF返回第一个集合与其他集合的差集O(N) (N 为第一个集合的大小)
SDIFFSTORE将第一个集合与其他集合的差集存储到一个新集合中O(N) (N 为第一个集合的大小)

Set 数据类型适用于需要存储一组唯一值的情况,例如标签、用户的兴趣爱好等。使用合适的 Set 相关命令,可以高效地进行成员的添加、删除、查找以及集合运算。

三、Set 类型编码方式

Redis 中的 Set 数据类型的内部编码方式有两种,分别是intsethashtable。这两种编码方式根据集合的大小和元素类型来选择,以最大程度地节省内存和提高性能。

  1. intset(整数集合)

    • 特点:intset 是 Redis 用于表示只包含整数值的集合的编码方式。它是一个有序的、紧凑的、不可重复的集合,内部使用整数表示元素值。

    • 适用场景:intset 适用于存储小型整数集合,因为它在内存占用和性能方面都非常高效。当集合中的元素都是整数且数量较少时,Redis 会选择使用 intset 编码。

    • 优点

      • 节省内存:intset 采用紧凑的二进制存储,每个整数只占用所需的字节。
      • 高效的查找和插入:由于元素都是整数且有序,查找和插入操作的时间复杂度是 O(log(N))。
  2. hashtable(哈希表)

    • 特点:hashtable 是 Redis 用于表示包含字符串、浮点数或其他数据类型的集合的编码方式。它是一个无序的、动态大小的集合,内部使用哈希表来存储元素。

    • 适用场景:hashtable 适用于存储包含各种数据类型的集合,以及大型集合,因为它可以动态增长并处理各种数据类型。

    • 优点

      • 适用性广泛:hashtable 可以存储不同类型的数据,而不仅限于整数。
      • 动态增长:可以随时添加或删除元素,适用于大型集合。

Redis 在使用 Set 类型时会根据集合的内容和大小自动选择 intset 或 hashtable 编码方式,以优化内存和性能。这种智能的编码方式选择是 Redis 内存管理的一部分,使得 Redis 在处理不同类型和大小的集合时能够充分发挥其优势。

四、Set 使用场景

场景:标签管理

假设你正在开发一个社交平台,需要为用户添加兴趣标签,并能够计算用户之间的共同兴趣标签。以下是如何使用 Redis 的集合数据类型来实现这个场景:

  1. 给用户添加标签

    用户A对娱乐、体育板块感兴趣,用户B对历史、新闻感兴趣,这些兴趣点可以被抽象为标签。

    SADD user:1:tags entertainment sports
    SADD user:2:tags history news
    

    这些命令将用户的标签信息存储在名为 user:1:tagsuser:2:tags 的集合中。

  2. 给标签添加用户

    现在,让我们为每个标签创建一个集合,用于存储对该标签感兴趣的用户。

    SADD entertainment:users user:1
    SADD sports:users user:1
    SADD history:users user:2
    SADD news:users user:2
    

    这些命令将用户与其对应的标签建立关联关系。

  3. 删除用户下的标签

    如果用户取消了对某些标签的兴趣,可以使用 SREM 命令来删除相应的标签。

    SREM user:1:tags sports
    

    这个命令将用户A的兴趣标签中的 “sports” 删除。

  4. 删除标签下的用户

    如果某个标签不再被用户关注,可以使用 SREM 命令来删除相应的用户。

    SREM sports:users user:1
    

    这个命令将用户A从 “sports” 标签的关注列表中移除。

  5. 计算用户的共同兴趣标签

    要计算两个用户的共同兴趣标签,可以使用 SINTER 命令。

    SINTER user:1:tags user:2:tags
    

    这个命令将返回用户1和用户2的共同兴趣标签。

通过这些 Redis 的集合操作,你可以轻松地实现标签管理功能,包括用户的兴趣标签添加、删除以及计算用户之间的共同兴趣标签。这对于增强用户体验和个性化推荐非常有帮助。

除了标签管理之外,Redis 的集合数据类型还适用于许多其他场景。以下是一些额外的场景示例:

  1. 社交网络关系:在社交网络应用中,你可以使用集合存储用户的好友列表、关注列表和粉丝列表,以及用户之间的共同好友等信息。这使得查找和管理社交关系变得非常高效。

  2. 在线用户管理:集合可以用于维护在线用户列表,快速检查用户是否在线,以及获取在线用户的数量和列表。这对于实时聊天、在线游戏等应用非常有用。

  3. 投票和计数:你可以使用集合来记录投票或计数的情况,例如统计文章的点赞数、收藏数、评论数等。每个用户可以在集合中表示一次投票或计数操作,而集合会自动去重。

更多推荐

一、八大排序(sort)

文章目录一、时间复杂度(一)定义:常数操作二、空间复杂度(一)定义:三、排序(一)选择排序1.定义2.代码3.特性(二)冒泡排序1.定义2.代码3.特性(三)插入排序1.定义2.代码3.特性(四)归并排序1.定义2.代码3.特性(五)快速排序(六)堆排序(七)基数排序(八)计数排序一、时间复杂度(一)定义:常数操作与数

口袋参谋:淘宝生意参谋指数,如何一键转换成真实数值?

在淘宝天猫上,我们是无法直接清楚的,了解竞品真实数据,因为平台为了保护商家的权益,将真实数值全部隐藏起来了,也就是变成了我们能看到的虚拟指数。那我们在生意参谋中,从市场排行、市场大盘等地方,看到的交易额、支付人数、转化率、收藏人数、加购人数等数据都是指数,而不是实际值。这样的话,我们在做竞品分析时,基本上就失去参考价值

nginx反向代理

nginx反向代理8.反向代理8.1实现http反向代理8.1.1反向代理配置参数8.1.2反向代理单台web服务器8.1.2.1端口号后加"/"8.1.2.2端口号后不加"/"8.1.3指定location实现反向代理,动静分离8.1.4反向代理实例:缓存功能8.1.4.1举例8.1.5实现反向代理客户端IP透传8.

2024得物校招面试真题汇总及其解答(一)

1.有哪些查找优化算法查找优化算法是指可以提高查找效率的算法。常见的查找优化算法包括:二分查找:二分查找是一种基于分治思想的查找算法。它首先将查找范围缩小一半,然后再在缩小后的范围内进行查找,以此类推,直到找到目标元素或判断目标元素不存在。二分查找的平均时间复杂度为O(logn),其中n是数据集的大小。哈希表:哈希表是

Java常见面试题

目录1、mysql并发事务会带来哪些问题,如何解决?2、请详细描述Redis持久化机制?3、简述Redis缓存雪崩和缓存穿透的问题和解决方案?4、RabbitMQ消息丢失及对应解决方案5、什么叫线程安全?举例说明6、举例说明常用的加密算法7、synchronized和ReentrantLock有什么区别?8、synch

【Python 基础篇】Python环境搭建

文章目录一、Python环境的下载二、Python环境变量的安装及配置三、Python编译器的选择一、Python环境的下载Python官方网站:www.python.org这个是Python的官方网站,Python下载以及相关文档都能在里面找到如果下载慢的话,可以在各大电脑应用市场下载(自己是在联想应用商店下载的)…

01-安装

1、安装前准备1.1、集群IP分布主机名IP地址角色备注kube-master192.168.168.60kube-master管理节点kube-node1192.168.168.61kube-node计算节点kube-node2192.168.168.62kube-node计算节点kube-node3192.168.

压缩算法---以golang/snappy为例

压缩,典型的时间换空间用到LRU,首选hashicorp/golang-lru,不过不知道啥时候,Go官方悄不溜整了一个groupcache,也提供了lru的实现…顺道瞟了一眼,发现github.com/golang下除去有go,还有一整套配套的常用组件。比如vscode/sublime的插件,有性能测试工具perf,

对不起,是我“造谣传谣”了

前天发布了一篇推文,传递了一条错误的信息:不连接VPN也可以访问Obsidian插件市场了。没想到一石激起千层浪,很多朋友留言反馈说:然后我慌了。自己竟“沦为”一个“造谣传谣”者,为此陷入“不知该如何处理”的慌乱之中。于是求助外援:然而,最让我感动的是,在纠结于“删”与“不删”期间,陆续收到很多朋友友善的留言。他们没有

【机组】计算机系统组成课程笔记 第二章 计算机中的信息表示

2.1无符号数和有符号数2.1.1无符号数没有符号的数,其实就是非负数。在计算机中用字节码表示,目前最常用的是八位和十六位的。2.1.2有符号数将正负符号数字化,0代表+,1代表-,并把代表符号的数字放在有效数字前,就组成了有符号数。1.机器数和真值我们接下来要用到的真值都指的是带符号的二进制数。机器数是相对于真值而言

activemq学习笔记

传统的request/response在客户端提交请求后必须等待服务端处理完毕给于反馈,这期间客户端完全处于空闲等待状态,甚至有可能超时;·基于消息中间件的request/response客户端提交请求,不必等待服务器处理,客户端可以继续进行其它操作,而服务端形成命令的消息列队,在空闲的时候进行处理,客户端可以异步接收

热文推荐