LRU缓存机制,你想知道的这里都有

article/2025/10/2 15:02:26

概述

LRU是Least Recently Used的缩写,译为最近最少使用。它的理论基础为 “最近使用的数据会在未来一段时期内仍然被使用,已经很久没有使用的数据大概率在未来很长一段时间仍然不会被使用” 由于该思想非常契合业务场景 ,并且可以解决很多实际开发中的问题,所以我们经常通过LRU的思想来作缓存,一般也将其称为LRU缓存机制。

原理

实现LRU时,我们需要关注它的读性能和写性能,理想的LRU应该可以在O(1)的时间内读取一条数据或更新一条数据,也就是说读写的时间复杂度都是O(1)

此时很容易想到使用哈希表,根据数据的键访问数据可以达到O(1)的速度。但是更新缓存的速度却无法达到O(1),因为需要确定哪一条数据的访问时间最早,这需要遍历所有缓存才能找到。

因此,我们需要一种既按访问时间排序,又能在常数时间内随机访问的数据结构。

这可以通过哈希表+双向链表实现:

  • 哈希表保证通过key访问数据的时间为O(1).
  • 双向链表则按照访问时间的顺序依次穿过每个数据。

之所以选择双向链表而不是单链表,是为了可以从中间任意结点修改链表结构,而不必从头结点开始遍历。

图解示例

假如我们设计一个容量大小为4的LRU缓存。

1.先添加4个元素

上排是哈希表的 key, 我们依次添加:k1, k2, k3, k4。 下排是哈希表的 node 结构体,里面包括(key, value) pair,我们用双向链表连接。分别为n1, n2, n3, n4
最新添加的在链表头部,表示最近使用。

当我们添加第四个元素的时候如图所示:

lru_1.png

2.添加k5

把k5放在哈希表中,然后把n5放在链表头部,此时由于hash表的size大于容量4,我们需要删除一个元素,从尾部删除,尾部代表最久没使用。
同时从哈希表中删除尾部n1对应的k1。

lru_2.png

3.访问k3

k3最近访问,把n3从当前位置删除,并插入到链表头部。

lru_3.png

结论:

  • 每次添加元素到链表中的时候都是从头部添加
  • 每次删除元素的时候都是从尾部删除
  • 删除的时候同时从哈希表里面删除对应的key
  • 再次访问的元素,需要把元素移动到链表的头部

Leetcode

Leetcode有LRU Cache经典算法题,这道题并不难,也是我当面试官经常考的一道题。
这道题算是LRU实现的简单版本,可以当作入门练习。

leetcode.com/problems/lr…

146. LRU 缓存机制

运用你所掌握的数据结构,设计和实现一个  LRU (最近最少使用) 缓存机制 。 实现 LRUCache 类:

  • LRUCache(int capacity) 以正整数作为容量 capacity 初始化 LRU 缓存
  • int get(int key) 如果关键字 key 存在于缓存中,则返回关键字的值,否则返回 -1 。
  • void put(int key, int value) 如果关键字已经存在,则变更其数据值;如果关键字不存在,则插入该组「关键字-值」。当缓存容量达到上限时,它应该在写入新数据之前删除最久未使用的数据值,从而为新的数据值留出空间。

进阶:你是否可以在 O(1) 时间复杂度内完成这两种操作?

C++解答:

#include<iostream>
#include<unordered_map>
using namespace std;class LRUCache {
public:struct Node {Node(int key, int val) {key_ = key;val_ = val;left_ = right_ = nullptr;}int key_, val_;Node* left_, *right_;};LRUCache(int capacity) {capacity_ = capacity;head_ = new Node(-1, -1);tail_ = new Node(-1, -1);head_->right_ = tail_;tail_->left_ = head_;}~LRUCache() {Node *node = head_;while (node != nullptr) {Node *next = node->right_;delete node;node = next;}}int get(int key) {if(hash_.count(key) == 0) return -1;Node *node = hash_[key];if (node->left_ != head_) {unlink(node);insertToHead(node);}return node->val_;}void put(int key, int value) {if (hash_.count(key) == 0) {if (hash_.size() >= capacity_) {Node *node = tail_->left_;unlink(node);hash_.erase(node->key_);delete node;}Node *node = new Node(key, value);hash_[key] = node;insertToHead(node);} else {Node *node = hash_[key];node->val_ = value;if (node->left_ != head_) {unlink(node);insertToHead(node);}}}void insertToHead(Node *node) {node->right_ = head_->right_;head_->right_ = node;node->left_ = head_;node->right_->left_ = node;}void unlink(Node *node) {node->left_->right_ = node->right_;node->right_->left_ = node->left_;}private:int capacity_;unordered_map<int, Node*> hash_;Node *head_, *tail_;
};
复制代码

开源项目应用

这里我会介绍LRU在各个常用的开源项目中的使用。
我会用尽量简短的语言概述,但是又能尽量包含关键信息。

Redis中使用LRU淘汰策略

Redis 作为缓存使用时,一些场景下需要考虑内存的空间消耗问题。
Redis 有很多淘汰策略,其中和LRU相关的有其中的两种:

allkeys-lru: 对所有的键都采取LRU淘汰
volatile-lru: 仅对设置了过期时间的键采取LRU淘汰

我们知道,LRU算法需要一个双向链表来记录数据的最近被访问顺序,但是出于节省内存的考虑,Redis的LRU算法并非完整的实现。

Redis并不会选择最久未被访问的键进行回收,相反它会尝试运行一个近似LRU的算法,通过对少量键进行取样,然后回收其中的最久未被访问的键。通过调整每次回收时的采样数量maxmemory-samples,可以实现调整算法的精度。
在Redis3.0中,还新增加了一个淘汰池,本质上它是一个大根堆,新随机出来的key会添加到淘汰池,然后淘汰最旧的key。

关于Redis的淘汰策略或者LRU源码分析,也可以单独出一遍博客分析,这里篇幅所限不做详细分析了。

MySQL中InnoDB引擎中缓存池LRU算法

InnoDB的缓存池:简单来说就是一块内存区域,该区域内缓存着InnoDB访问存储在磁盘的数据和索引信息。缓冲池有两个作用,一是提高了大容量读取操作的效率,二是提高了缓存管理的效率。
MySQL的InnoDB引擎从磁盘加载数据页到缓存池时,往往连带着目标数据页相邻的数据页一起加载到缓存池中--MySQL预读机制
为什么MySQL会存在预读机制呢?
其实就是提升性能。

但是另一方面可能会发生,预读进去的数据页几乎不被访问,但是由于LRU的特性,这部分数据页在预读进去后会处于链表的头节点附近,还可能淘汰一部分本身访问比较频繁的数据页。

所以MySQL采用了基于冷热隔离的LRU策略
LRU链被拆为两部分:一部分存储热数据,一部分存储冷数据
当数据初次加载到缓存池中时,会首先放在冷链的头部,经过 innodb_old_blocks_time (默认1s)后如果再被访问,则将缓存页移动至热链头部。

实际业务使用

实际业务中主要针对热点数据使用内存LRU缓存来降低后端数据库或者Redis缓存的压力。

电商大促

大促期间秒杀促销或者人气店铺

我们在实际业务中使用了LRU缓存,主要是为了解决热点数据的访问问题。

我们的一些数据存在MySQL中,然后使用Redis的集群作为缓存。平时由于命中率比较高,MySQL的读取的QPS相对比较低,一切都很顺利。

但是在一些大促活动期间(双11),有些热门店铺的访问量就非常高,就导致了一些热点数据,其中几个Redis节点的CPU就直接100%使用率。
于是我们针对热点数据,我们让它通过LRU缓存,来极大的缓解Redis和MySQL的压力。

怎么区分热点数据呢,有两种方式:

  • 我们可以在服务端设置一些规则区分热点,请求数据满足特定的规则就认为是热点数据。
  • 也可以在API请求中加入一个标记来告诉服务端这个请求的数据当作热点数据来处理,比如秒杀页面的请求就可以自动带有这个标记。

当请求到达的时候,就看是否匹配热点标记,如果是热点数据,查询LRU缓存,如果命中直接返回。 不命中就继续向Redis读取,并写入LRU,Redis如果也不命中就向MySQL读取,写入Redis。这样层层的方式,可以极大的减轻Redis和MySQL的压力。

lru_4.png

微博热搜

还有一种类似的场景就是微博热搜。 微博热搜也是一种瞬间大流量的热点数据,经常听到明星八卦导致微博直接宕机,就是热点数据没有处理好的会导致的风险。
一般可以对从热点页面进入的请求或者被服务器标记为热点的事件,都当做是热点数据,经过LRU缓存。

总结

LRU是一个在产品业务中很有用的算法,它追求空间的利用率,使用权衡的方案来把最近最少访问的数据剔除出内存。是一个很有用的算法,同时也是找工作面试中经常考察的算法之一,值得我们好好学习。


http://chatgpt.dhexx.cn/article/PeCq2Au3.shtml

相关文章

LRU简单实现-了解一下

LRU 算法 LRU 是一种作为缓存的算法&#xff0c;像 CPU 缓存&#xff0c;数据库缓存&#xff0c;浏览器缓存。以及在移动端开发时的图片安缓存&#xff0c;采用 LRU 缓存策略的应用很广泛。在面试中也是常常考察的一个点。当然也有其他缓存方法&#xff0c;常见的策略有三种&a…

数据分析:RFM模型

补充&#xff1a; RFM分析方法&#xff1a;如何对用户按价值分类 深入解读和应用RFM分析方法(模型) 深入解读RFM模型-实战应用干货 转载自&#xff1a; 接地气的陈老师|作者 接地气学堂|来源&#xff1a;https://mp.weixin.qq.com/s/00vJPb9xqx4NL5Y5cPDXsw 问他咋做数据分…

数据分析之RFM模型

一.均值 RFM模型算法 从csv文件中读取相应的数据 datapd.read_csv(./dataset.csv,encodingISO-8859-1)#读取2014年的客户信息 data_14data[data[Order-year]2014] data_142.获取相应的列 data_14 data_14[[CustomerID,OrderDate,Sales]] data_14 CustomerID为用户id OrderD…

【数据分析】基于RFM模型的线上零售中的客户细分(二):RFM模型实战

基于RFM模型的线上零售中的客户细分&#xff08;二&#xff09; 摘要&#xff1a;在上一篇博客《基于RFM模型的线上零售中的客户细分&#xff08;一&#xff09;&#xff1a;客户细分》中&#xff0c;我们了解了什么是客户细分&#xff0c;这篇博客将会结合具体的商业实例介绍同…

数据分析 一文搞懂什么是RFM模型

数据分析 | 一文搞懂什么是RFM模型 想知道你在电商平台心里的地位吗&#xff1f;学会RFM分析法&#xff0c;你自然知道 大家好&#xff0c;我是翔宇&#xff01;今天我们来了解做数据分析一定要会的分析方法之一----RFM分析法。 相信大家在前天的双十一一定也多多少少贡献了…

RFM模型原理详解与实操运用

RFM模型原理详解与实操运用 RFM模型原理介绍为什么要使用RFM模型RMF模型原理介绍RFM模型用户细分 RFM模型实例操作背景/数据介绍RFM模型异化构建代码实现 最近在 运营课程中学习了RFM模型&#xff0c;又正正好在 商务智能的课程中学习了使用K-Means聚类分析实现RFM的操作。 …

如何利用RFM分析模型进行数据分析?

RFM模型 RFM主要根据客户活跃程度和平台交易金额贡献所做的分类。 近度&#xff1a;用字母R表示&#xff0c;代表客户最近一次的活跃距离目前的天数。在这部分客户中&#xff0c;有些优质客户值得通过一定的营销手段进行激活。 频度&#xff1a;用字母F表示&#xff0c;代表…

对RFM模型的理解

客户价值可以衡量客户对企业的相对重要性&#xff0c;是企业进行差异化决策的重要标准。 由此&#xff0c;通过客户价值分类可以为企业进行差异化营销策略奠定基础。 RFM模型对客户价值分类时非常简单的一种模型 以下从几大模块说一下个人对RFM模型的理解。 1.RFM模型是什么 …

RFM分析方法

RFM分析方法 RFM分析方法RFM指标介绍RFM指标作用如何使用RFM分析方法如何精细化运营 如何给R、F、M打分-采用数据分组确定分组的范围和标准利用VLOOKUP匹配函数函数 RFM分析方法 RFM指标介绍 R:最近一次消费时间间隔&#xff08;Recency&#xff09; R越小用户价值越高F:消费…

用户行为分析模型——RFM模型

用户行为分析模型——RFM模型 1. RFM模型2. RFM模型分析应用 1. RFM模型 RFM模型根据客户活跃程度和交易金额的贡献&#xff0c;进行客户价值细分的一种方法。 R&#xff08;Recency&#xff09;——最近一次交易时间间隔。基于最近一次交易日期计算的得分&#xff0c;距离当前…

客户价值模型:RFM

文章目录 1.1、RFM 模型引入1.1.1、RFM 模型介绍1.1.1.1、一般情况下RFM模型可以说明下列几个事实&#xff1a;1.1.1.2、对最近一个月内所有用户订单数据进行统计RFM值&#xff1a; 1.1.2、RFM 模型的三个指标&#xff1a;1.1.2.1、R&#xff1a;最近一次消费&#xff08;recen…

RFM分析(Recency,Frequency,Monetary)

通过RFM方法&#xff0c;我们根据用户的属性数据分析&#xff0c;对用户进行了归类。在推送、转化等很多过程中&#xff0c;可以更加精准化&#xff0c;不至于出现用户反感的情景&#xff0c;更重要的是&#xff0c;对产品转化等商业价值也有很大的帮助。 应用背景&#xff1a;…

R语言 RFM分析

目录 一、RFM分析的定义&#xff1a; 二、RFM分析的假设 三、RFM分析的步骤 四、RMF分析实例 4.1 数据准备 4.2 计算R/F/M 4.3 将R、F、M分组打分赋值 4.4 计算RFM综合分值 4.5 客户分类 4.6 完整代码 注&#xff1a;个人学习笔记--谁说菜鸟不会数据分析 R语言篇 一、…

[数据分析] RFM分析方法

美图欣赏2022/06/08 RFM分析方法 作用:对用户分类&#xff0c;识别出有价值的用户&#xff0c;对不同价值的用户使用不同的运营决策&#xff0c;把公司有限的资源发挥到最大的效果(用于用户价值细分&#xff0c;精细化运营) RFM是3个指标的缩写:最近1次消费时间间隔(Recency)…

深入解读RFM模型-实战应用干货

今天想先谈谈传统企业和电商谈的较多的RFM模型&#xff0c;在众多的客户细分模型中&#xff0c;RFM模型是被广泛提到和使用的。 一、RFM模型概述 RFM模型是网点衡量当前用户价值和客户潜在价值的重要工具和手段。RFM是Rencency&#xff08;最近一次消费&#xff09;&#xff…

如何进行有效的RFM模型搭建和分析?

“ RFM分析&#xff0c;是用户精细化运营中比较常见的分析方法了。” 今天和大家分享一篇历史文章&#xff0c;内容做了微调。是数据分析中比较常用的一个分析框架&#xff1a;RFM分析。该模型用的很多&#xff0c;说明有模型自身的优势&#xff1b;但同时也存在很多的问题。今…

概念+实战讲解,一文带你了解RFM模型【kaggle项目实战分享】数据分析

大家早上好&#xff0c;本人姓吴&#xff0c;如果觉得文章写得还行的话也可以叫我吴老师。欢迎大家跟我一起走进数据分析的世界&#xff0c;一起学习&#xff01; 感兴趣的朋友可以关注我或者我的数据分析专栏&#xff0c;里面有许多优质的文章跟大家分享哦。 &#xff08;有需…

三线性插值(三维线性插值)

三线性插值&#xff08;trilinear interpolation&#xff09;主要是用于在一个3D的立方体中&#xff0c;通过给定顶点的数值然后计算立方体中其他点的数值的线性插值方法。 具体推导过程见参考资料1&#xff0c;这里直接给出最终公式&#xff1a; 其中&#xff0c;坐标(x,y,z…

快速三线性插值

转载自https://lianera.github.io/post/2018/fast-trilinear-interpolation/ 快速三线性插值 最近需要对一个体素进行插值&#xff0c;并且应用到一张大图像上。这个本来用三线性插值很容易就实现了&#xff0c;但是体素的尺寸很小&#xff0c;长宽高大概20x15x10的大小&#x…

线性插值、双线性插值、双三次插值学习笔记-图像处理

缺失值之线性插值 interpolate用法 在series中有两个空值 用图的方式表示出四个点 使用线性插值后的结果如下 使用代码演示 线性插值后的结果 再加入一条数据 结果如下 使用pandas中的DataFrame 运行结果&#xff0c;默认在垂直方向上使用线性插值 设置水平方向上的线性插值 …