数据分析:RFM模型

article/2025/10/2 15:02:26

补充:

RFM分析方法:如何对用户按价值分类

深入解读和应用RFM分析方法(模型)

深入解读RFM模型-实战应用干货


转载自:

接地气的陈老师|作者
接地气学堂|来源:https://mp.weixin.qq.com/s/00vJPb9xqx4NL5Y5cPDXsw


问他咋做数据分析,张口就来RFM,结果还用错!

一、RFM基本原理

RFM是三个单词的缩写:

最近一次消费时间 (Recency),取数的时候一般取最近一次消费记录到当前时间的间隔,比如7天、30天、90天未到店消费。直观上,一个用户太久不到店消费,肯定是有问题,得做点什么事情。很多公司的用户唤醒机制都是基于这个制定的。

在这里插入图片描述

一定时间内消费频率 (Frequency),取数时,一般是取一个时间段内用户消费频率。比如一年内有多少个月消费,一个月内有多少天到店等等。直观上,用户消费频率越高越忠诚。很多公司的用户激励机制都是基于这个制定的,买了一次还想让人家买第二次。

一定时间内累计消费金额(Monetary) ,取数时,一般是取一个时间段内用户消费金额。比如一年内有多少消费金额。直观上,用户买的越多价值就越大。很多公司的VIP机制是基于这个指定的,满10000银卡,满20000金卡一类。

在这里插入图片描述

所以,即使单独看这三个维度,都是很有意义的。当然,也有把三个维度交叉起来看的(如下图)。

在这里插入图片描述

因为RFM与时间有关,因此很多同学在取数的时候会纠结时间怎么分。严格来说,越柴米油盐,消费频次本身越高的业务,取的时间应该越短。最典型的就是生鲜,人天天都要吃饭,7天不来可能就有问题。普通的快消品零售可能取30天,类似服装百货零售可能取90天。当然,更多的做法是按月取。比如R按月取,F、M算最近一年内的数值。这样做单纯是因为比较方便理解而已。

RFM本质上是一种用三个分类维度,找判断标准方法。通过三个维度的组合计算,能判定出用户的好坏,然后采取对应措施。

RFM的真正意义,在于:这是一种从交易数据反推用户价值的方法,因此可行性非常高!要知道:做数据分析的最大瓶颈是数据采集,而只要是个正常企业,交易数据是肯定有的。因此只要企业建立了用户ID统一认证机制,就能将用户ID与交易数据关联起来,就能用RFM来分析用户了。即使没有埋点、没有网站、没有基础信息也能做,简直是方便好用的神器。

当然,所有方便好用的工具,都自带一些不足,RFM模型也是如此。

二、RFM的最大短板

**RFM最大的短板,在于用户ID统一认证。**不要小看这几个字,在相当多的企业里非常难实现。比如你去超市、连锁店、门店买东西,往往收银小妹会机械的问一句:有会员卡吗?如果回答没有,她也放你过去了。导致的结果,是线下门店的订单,一般有70%-90%无法关联到用户ID,进而导致整个用户数据是严重缺失的,直接套RFM很容易误判用户行为。

至于用户一人多张会员卡轮流薅羊毛,多个用户共同一张VIP卡拿最大折扣,店员自己用亲戚的卡把无ID订单的羊毛给薅了之类的事,更是层出不穷,而且在实体企业、互联网企业都普遍存在。**所以做RFM模型的时候,如果你真看到111类用户,别高兴太早,十有八九是有问题的。**现在的企业往往在天猫、京东、自有微商城、有赞等几个平台同时运作,更加大了统一认证的难度。如果没有规划好,很容易陷入无穷无尽的补贴大坑。

三、RFM的深层问题

即使做好了用户ID统一认证,RFM还有一个更深层的问题。

让我们回顾一下,RFM模型的三个基本假设:

R:用户离得越久就越有流失风险
F:用户频次越高越忠诚
M:用户买的越多越有价值

反问一句:这三个假设成立吗?如果不结合具体行业、具体产品、具体活动来看,似乎是成立的。但是一旦具体讨论就会发现:很多场景不满足这三个假设。因此:单纯讲RFM,不结合产品、活动,是很容易出BUG的。

R:用户离得越久就越有流失风险
如果是服装这种季节性消费,用户间隔2-3个月是很正常
如果是手机、平板这种新品驱动产品,间隔时间基本跟着产品更新周期走
如果是家居、住房、汽车这种大件耐用品,R就没啥意义,用户一辈子就买2次
如果是预付费,后刷卡的模式,R就不存在了,需要用核销数据代替

所以R不见得就代表着用户有流失风险,特别是现在有了埋点数据以后,用户互动行为更能说明问题。

F:用户频次越高越忠诚
如果用户消费是事件驱动的,比如赛事、节假日、生日、周末……
如果用户消费是活动驱动的,比如啥时候有优惠啥时候买……
如果用户消费是固定模式的,比如买药的用量就是30天……

以上情况都会导致F的数值不固定,可能是随机产生的,也可能是人为操纵的。很多企业僵硬地执行RFM模型,往往会定一个固定的F值,比如促使用户买4次,因为数据上看买了4次以上的用户就很忠诚。结果就是引发用户人为拆单,最后F值做上去了,利润掉下来了。

M: 用户买的越多越有价值
如果用户是图便宜,趁有折扣的时候囤货呢?
如果用户买了一堆,已经吃腻了、用够了呢?
如果用户买的是耐用品,买完这一单就等十几二十年呢?
如果用户消费本身有生命周期,比如母婴,游戏,已经到了生命周期末尾呢?

很多情况下,用户过去买的多,不代表未来买的多。这两者不划等号。因此真看到011、001、101的客人,别急着派券,整明白到底出了啥问题才是关键。

除了单独维度的问题外,三个维度连起来看,也容易出问题。因为很多公司的用户结构不是金字塔形,而是埃菲尔铁塔型:底部聚集了太多的不活跃用户,且不活跃用户大多只有1单,或者只有几次登录便流失,因此RFM真按八分类化出来,可能000的用户比例特别多。

这意味着现有存活的用户,可能是幸存者偏差的结果,现有的111不是000的未来。要更深层次地分析为啥会沉淀大量不活跃用户,甚至从根上改变流程,才能解决问题。真按照RFM生搬硬套。可能就把业务带到死胡同里了。

四、RFM的典型乱用

RFM本身并没有错,在数据匮乏(特别是缺少埋点数据)的情况下,用RFM比不用RFM好太多了。RFM的三个维度,每一个都很好用。RFM的整体架构,也适合用于评估用户经营的整体质量。错的,是生搬硬套RFM,不做深入分析。错的是看到买了大单的就叫爸爸,看到用户不买就急着发券的无脑做法。一味派券不但严重透支营销成本,更会培养出更多薅羊毛用户,破坏了正常经营,只为了RFM的数值好看。

特别是网上文章、网课最喜欢教的:按RFM,每个拆分成5段,分成555=125类,然后再用K均值聚类聚成5-8类的做法,更是大错特错。

一来,经过K均值聚类以后,连RFM原有的含义清晰的优点都没有了,到底这8类咋解读,非常混乱。

二来,这样做没有考虑数据滚动更新,过了一周或者一个月,RFM指标都变了呀!难道你还天天把全量用户拿出来聚类吗。

三来,k均值聚类不是一个稳定的分类方法,无监督的分类更适合做探索性分析。隔了一周,一个用户被分成完全不同的两类,这会让市场营销、运营策划执行政策的时候非常抓狂:一天一个样,到底要推什么!

本质上看,因为网课、网文给的都是一张清洗得完美的静态数据表,一不需要跟别的部门合作,二不需要考虑连续场景,所以才选了一个模型+算法的做法。嗯,能不能用不重要,显得自己牛逼最关键!

五、如何让RFM更有用

综合RFM失效的场景,可以看出:季节性、商品特征、促销活动、节假日事件、用户生命周期,这五大要素,都会影响到用户的行为。因此不局限于RFM,深入研究用户场景非常关键。

注意,这五大要素研究起来,并没有想象中的难。比如很多商品有内在的关联性,只要熟悉业务就能整明白。比如季节性、节假日事件,本质上都和时间有关,因此,对用户登录、消费的时间打上标签,就能进行分析(如下图)。促销活动也是同理,促销活动可以直接从订单识别出来,因此也很容易给用户贴上:促销敏感型的标签。

在这里插入图片描述

用户生命周期,需要数据采集,而且是采集一个最关键的数据即可。最典型的用户生命周期是母婴行业做法,企业一定会采集一个最关键的数据:怀孕多少周了。这个数据爸爸们不见得清楚,妈妈们一定很清楚。知道了起点,后续就可以推算了。类似的还有药店连锁做慢病管理,K12教育等等。

六、小结

任何模型都有其产生的历史背景、数据基础、使用范围,也不是所有模型的目的都是精准。简单、好用、省事,是更多时候的考虑。

因此再次强烈建议同学们,不要沉迷于当知识收集者,企图找到《宇宙唯一真理模型》然后死记硬背,顶礼膜拜。多研究自己工作的行业特点,改造方法为我所用,才是让数据发挥更大作用的方法。说起死记硬背,然后乱用的模型,除了RFM还有很多。比如关联分析,都快2021年了,居然还有人信啤酒与尿布,被乱用得也是一塌糊涂,有兴趣的话,关注微信公众号【接地气学堂】,我们下一篇分享,敬请期待哦。

作者:接地气的陈老师,微信公众号:接地气学堂。十年资历的数据分析师,推出的数据分析系列课程,已有逾2万学员。


http://chatgpt.dhexx.cn/article/wy5pqBdB.shtml

相关文章

数据分析之RFM模型

一.均值 RFM模型算法 从csv文件中读取相应的数据 datapd.read_csv(./dataset.csv,encodingISO-8859-1)#读取2014年的客户信息 data_14data[data[Order-year]2014] data_142.获取相应的列 data_14 data_14[[CustomerID,OrderDate,Sales]] data_14 CustomerID为用户id OrderD…

【数据分析】基于RFM模型的线上零售中的客户细分(二):RFM模型实战

基于RFM模型的线上零售中的客户细分(二) 摘要:在上一篇博客《基于RFM模型的线上零售中的客户细分(一):客户细分》中,我们了解了什么是客户细分,这篇博客将会结合具体的商业实例介绍同…

数据分析 一文搞懂什么是RFM模型

数据分析 | 一文搞懂什么是RFM模型 想知道你在电商平台心里的地位吗?学会RFM分析法,你自然知道 大家好,我是翔宇!今天我们来了解做数据分析一定要会的分析方法之一----RFM分析法。 相信大家在前天的双十一一定也多多少少贡献了…

RFM模型原理详解与实操运用

RFM模型原理详解与实操运用 RFM模型原理介绍为什么要使用RFM模型RMF模型原理介绍RFM模型用户细分 RFM模型实例操作背景/数据介绍RFM模型异化构建代码实现 最近在 运营课程中学习了RFM模型,又正正好在 商务智能的课程中学习了使用K-Means聚类分析实现RFM的操作。 …

如何利用RFM分析模型进行数据分析?

RFM模型 RFM主要根据客户活跃程度和平台交易金额贡献所做的分类。 近度:用字母R表示,代表客户最近一次的活跃距离目前的天数。在这部分客户中,有些优质客户值得通过一定的营销手段进行激活。 频度:用字母F表示,代表…

对RFM模型的理解

客户价值可以衡量客户对企业的相对重要性,是企业进行差异化决策的重要标准。 由此,通过客户价值分类可以为企业进行差异化营销策略奠定基础。 RFM模型对客户价值分类时非常简单的一种模型 以下从几大模块说一下个人对RFM模型的理解。 1.RFM模型是什么 …

RFM分析方法

RFM分析方法 RFM分析方法RFM指标介绍RFM指标作用如何使用RFM分析方法如何精细化运营 如何给R、F、M打分-采用数据分组确定分组的范围和标准利用VLOOKUP匹配函数函数 RFM分析方法 RFM指标介绍 R:最近一次消费时间间隔(Recency) R越小用户价值越高F:消费…

用户行为分析模型——RFM模型

用户行为分析模型——RFM模型 1. RFM模型2. RFM模型分析应用 1. RFM模型 RFM模型根据客户活跃程度和交易金额的贡献,进行客户价值细分的一种方法。 R(Recency)——最近一次交易时间间隔。基于最近一次交易日期计算的得分,距离当前…

客户价值模型:RFM

文章目录 1.1、RFM 模型引入1.1.1、RFM 模型介绍1.1.1.1、一般情况下RFM模型可以说明下列几个事实:1.1.1.2、对最近一个月内所有用户订单数据进行统计RFM值: 1.1.2、RFM 模型的三个指标:1.1.2.1、R:最近一次消费(recen…

RFM分析(Recency,Frequency,Monetary)

通过RFM方法,我们根据用户的属性数据分析,对用户进行了归类。在推送、转化等很多过程中,可以更加精准化,不至于出现用户反感的情景,更重要的是,对产品转化等商业价值也有很大的帮助。 应用背景:…

R语言 RFM分析

目录 一、RFM分析的定义: 二、RFM分析的假设 三、RFM分析的步骤 四、RMF分析实例 4.1 数据准备 4.2 计算R/F/M 4.3 将R、F、M分组打分赋值 4.4 计算RFM综合分值 4.5 客户分类 4.6 完整代码 注:个人学习笔记--谁说菜鸟不会数据分析 R语言篇 一、…

[数据分析] RFM分析方法

美图欣赏2022/06/08 RFM分析方法 作用:对用户分类,识别出有价值的用户,对不同价值的用户使用不同的运营决策,把公司有限的资源发挥到最大的效果(用于用户价值细分,精细化运营) RFM是3个指标的缩写:最近1次消费时间间隔(Recency)…

深入解读RFM模型-实战应用干货

今天想先谈谈传统企业和电商谈的较多的RFM模型,在众多的客户细分模型中,RFM模型是被广泛提到和使用的。 一、RFM模型概述 RFM模型是网点衡量当前用户价值和客户潜在价值的重要工具和手段。RFM是Rencency(最近一次消费)&#xff…

如何进行有效的RFM模型搭建和分析?

“ RFM分析,是用户精细化运营中比较常见的分析方法了。” 今天和大家分享一篇历史文章,内容做了微调。是数据分析中比较常用的一个分析框架:RFM分析。该模型用的很多,说明有模型自身的优势;但同时也存在很多的问题。今…

概念+实战讲解,一文带你了解RFM模型【kaggle项目实战分享】数据分析

大家早上好,本人姓吴,如果觉得文章写得还行的话也可以叫我吴老师。欢迎大家跟我一起走进数据分析的世界,一起学习! 感兴趣的朋友可以关注我或者我的数据分析专栏,里面有许多优质的文章跟大家分享哦。 (有需…

三线性插值(三维线性插值)

三线性插值(trilinear interpolation)主要是用于在一个3D的立方体中,通过给定顶点的数值然后计算立方体中其他点的数值的线性插值方法。 具体推导过程见参考资料1,这里直接给出最终公式: 其中,坐标(x,y,z…

快速三线性插值

转载自https://lianera.github.io/post/2018/fast-trilinear-interpolation/ 快速三线性插值 最近需要对一个体素进行插值,并且应用到一张大图像上。这个本来用三线性插值很容易就实现了,但是体素的尺寸很小,长宽高大概20x15x10的大小&#x…

线性插值、双线性插值、双三次插值学习笔记-图像处理

缺失值之线性插值 interpolate用法 在series中有两个空值 用图的方式表示出四个点 使用线性插值后的结果如下 使用代码演示 线性插值后的结果 再加入一条数据 结果如下 使用pandas中的DataFrame 运行结果,默认在垂直方向上使用线性插值 设置水平方向上的线性插值 …

插值(Interpolation)

前言 插值计算普遍存在于图像处理中,最近在做畸变优化时,看了一些资料中提到了插值&双线性插值,开始没明白,觉得一定很难,直接跳过,到最终写代码时,又不得不使用.于是就这里对这个功能进行学习,记录,并使用vs2017进行实际验证,验证后发现这个原理其实并不复杂. 插值 插值…

三点线性插值

问题: 在三角形的三个顶点具有3个不同颜色,如何通过插值计算出三角形中每个点的颜色? 应用实例:高洛德着色使用3个顶点的颜色进行线性插值,结果如下图: 解决方案: 显然,无论是线性…