京东用户行为分析

article/2025/10/13 17:35:02

京东用户行为分析

  • 项目背景

京东作为传统电商巨头,京东商城与京东物流的发展相得益彰,然而各种新兴的电商模式,带来了千人千面的购物方式和电商平台更加激烈的竞争,电商平台­­­发展初期的粗放式经营也转向了利用大数据和算法,基于用户行为,实现精细化营销。在这样的背景下,本文基于京东平台的部分数据进行了用户行为分析。

本次分析的目的主要是从数据中探索以下问题,得出结论,并提供一些可行性的建议:

  1. 分析用户在使用App整个过程中的特点,从获客,激活,留存,营收等方面,寻找可以优化的点
  2. 对用户购买行为进行分析,找出用户行为转化中存在的问题,最受欢迎的商品,找到针对用户运营和商品推荐的方向
  3. 进行用户价值分析,对用户进行分层,采用更有针对性的营销

  • 分析框架

数据集介绍

原始数据为京东竞赛数据集,数据集共有五个列表文件,包含了“2018-02-01”至“2018-04-15”之间在京东平台的用户行为数据,评论数据,商品数据,商家店铺数据以及用户数据

在本次分析过程中,需要用到的用户行为数据,商品数据,以及用户数据,原始数据集中行为数据列表过大,故截取了2018-04-01”至“2018-04-15”的数据,对用户行为数据集进行清洗:

jdata_action:
user_id
用户唯一标识
sku_id
商品唯一标识
action_time
行为时间
数据清洗时拆分成date,hour,weekday
type

1.pv  2.pay  3.fav  4.comm  5.cart

jdata_product:

sku_id

商品唯一标识

brand

品牌名

shop_id

店铺id

cate

品类

market_time

商品上市时间

jdata_user:

User_id

用户唯一标识

Age

年龄,-1表示未知,数字越大,年龄越大

Sex

性别  0:男  1:女  2: 保密

User_reg_tm

注册时间

User_lv_cd

会员级别,数字越大,级别越高

City_level

城市等级,常用收货地址,数字越大,等级越高

Province

省份

City

城市

County

分析框架

 

  • 分析过程

(一)基于平台运营流程的AARRR模型分析

(1)每日新增uv

由于数据截取,前面几天老客数据不能完全计算,数据会有偏差,可以看出后面几天日新增uv基本稳定在30%左右。

(2)用户在不同时间维度下的活跃情况

 

日期维度下,pv和uv比较平稳,4.1—4.9日小幅波动,4.10开始递减,推测数据波动是由小规模营销活动产生。

星期维度下,pv和uv无明显波动,周日到周一周二的日均pv和uv略高,周五的pv相较于uv增加得更多,说明周末开始用户有更多的点击行为,这也可以为每周活动运营做一个参考,即每周活动可以放在周五晚开始,利用周末用户更多的浏览时间,并在周日晚上加大活动力度或是限时促销活动,促进销量。

小时维度下,pv和uv波动较大,在凌晨呈下降趋势,在凌晨3-4点达到最低,随后不断上升,在上午10点左右有一个小高峰,晚上19点之前pv和uv都比较平稳,晚上19—22点这段时间,用户访问行为达到最高峰。因此上午8-10点,晚上19-22点是各类活动运营非常关键的时间段,凌晨1-4点适合作为系统维护时间。

(3)留存率分析

由于截取的是部分时间数据,前两天的留存率会相对较高,但从总体看,用户留存率基本维持在10%--20%。根据Facebook的40-20-10法则,在所考察的时间范围内,平台的留存率低于标准,但留存率递减较慢,说明平台的用户依赖性较高,但同时也可以通过一些运营策略来提高平台的留存率:

通过活动刺激,引导新用户产生关键行为,如新人福利,减免卡券,每日签到等。引导客户熟悉会员体系与积分体系,优化用户使用流程,让用户在初次接触平台时能产生较好的用户体验,从而提高用户粘性。

(4)营收情况分析

因为数据中缺少付费金额,所以用付费次数代替,从上图可知,在所考察的时间周期,86%的用户只有一次购买行为,9%的用户有两次购买行为,每日的ARPPU约为1.1,绝大部分付费用户的购买次数相对比较低,复购率为0.1316。

(二)用户购买行为分析

(1)when用户在什么时间购买 

  

每日的付费用户数大约占总独立访客数的30%,星期维度下,周六周日的付费用户数占比略高。

小时维度下,用户的购买行为在上午10点和晚上22点达到两个峰值,相对于pv来说,在上午10点付费用户更多,晚上总体pv非常高,但付费用户数略低于上午10点,说明晚上用户浏览平台,有部分是“逛京东”,实际转化率相对较低,因此上午10点左右,注重商品的精准推荐,通过优惠券,限时折扣活动,促进付费转化,晚上19—22点,注重商品多样化推荐,提高用户“逛京东”的体验,同时设置限时秒杀活动,即时促进转化率。 

(2)who购买次数前200的用户画像

从四个维度进行分析:年龄(等级数字越大,年龄越大),性别,城市等级(数字越大,城市等级越高),会员等级(数字越大,会员等级越高)

消费次数排名前200位的用户中:

年龄方面,主要是年龄等级比较大的用户,这类用户相对来说,收入水平较高,购买力较强

性别方面,男性用户略多于女性用户,细分来看,年龄等级稍高,中年人群体中,女性用户较多,而在年龄等级较低的用户中,男性用户,明显多于女性用户

会员等级方面,消费较多的是等级较高的的用户,其中等级较高的男性用户数相对更多

城市等级方面,主要是城市等级中等的,注意到城市等级最低的用户数也比较多

从以上分析,可以重点关系以下几类用户

①等级较高,年龄较大的用户;

②中年女性用户;

③城市等级较低的用户;

④年龄等级较低的男性用户

(3)what用户浏览最多的产品,用户购买最多的产品

浏览量Top10品类                                                             

    

购买量Top10品类

数据集中,品类数为80,平台覆盖的品类非常丰富,浏览量和购买量Top10的品类基本重合,说明这10大品类确实是用户最关注,最主要的消费品类,因此在做选品方面需要优先涉及到这10大品类。

进一步分析浏览量和购买量较高的商品及其所属品类: 

浏览量Top10的商品及其所属的品类    

 

购买量Top10的商品及其所属的品类

    

浏览量前10的商品中,品类7有5件商品,只有224207这件商品购买量排在前10,品类34有3件商品排在前10,但是没有购买量占前10的商品。

购买量前10的商品所属的品类相对分散,说明每个品类都有其热销款,品类27有3款商品的购买量都排在前10,而且购买转化率比较高

浏览量前10的商品中,有6件商品的购买转化率为0%,可进一步分析原因:系统数据异常,产品价格,产品详情页,是否缺货导致。对于品类7可以对比分析购买量排在前10的商品和其他几个转化率为0的商品。

(4)how购买行为转化漏斗

  

在所考察的时间周期内,浏览—购买的转化率为21.55%,浏览—加入购物车—购买的转化率为17.27%,直接购买转化率较高,说明用户倾向于使用较为简单的购买方式

浏览—加入购物车—购买这一路径中,加入购物车—购买的转化率为60%,相对较高,说明用户对于加入购物车的商品购买意向比较高,此时可以通过消息提醒,以及推出限时优惠券,提高购物车商品的转化率

浏览—收藏—购买这一路径中,浏览—收藏转化率非常低,仅为3.32%。结合App页面进行分析,可能原因是:1.收藏功能是用形状表示的,而非文字,不容易引起用户的注意,这一功能的使用率就比较低;2.收藏的商品后期查看也没有购物车功能方便,由于这部分的分析没有相关的数据支撑,无法得出准确的结论,可以通过设计问卷进行调查,从而进行系统的优化

浏览—收藏—购买这一路径中,收藏—购买转化率为48%,近一半加入购物车的用户会付费购买,说明提高收藏功能的使用,有助于提高付费率,因此可以优化收藏功能的展示,以及收藏功能查看商品信息的优化,提升用户体验,促进付费

(三)用户价值分层RFM模型分析

根据最近一次消费时间间隔和消费频次,对其赋分,以其平均值作为参考线,可以将用户分为四类:

第I象限:最近一次消费时间与消费频次都为高分,该类用户近期有消费,且消费频率较高,属于高价值用户,对这类用户可以提供更多的会员活动以及VIP专属活动,提升用户被平台重视的体验感。

第II象限:最近一次消费时间得分低,消费频次得分较高,该类用户购买频次较高,但是最近一次购买的间隔时间比较长,存在用户流失的风险,对这类用户需要采取活动短信推送,客户端push提醒用户,并通过分析用户对产品的核心诉求与行为特征,有针对性地策划营销活动促进用户找回,并在找回后做好维护。

第III象限,最近一次消费时间与消费频次都为低分,该类用户近期无消费,且消费频次较低,属于机会用户,其价值有待挖掘,可以先根据用户画像,评估用户价值与成本,对于潜在价值较高的用户,向其推出一些试用活动以及优惠券,提升活跃度,培养平台购物习惯。 

第IV象限,最近一次消费时间得分高,消费频次得分低,该类用户最近有消费,但消费频次较低,属于需要深耕的用户,在用户购买行为后,做好售后服务,提升用户体验,并及时推送用户浏览量较高的商品,促进其复购。

  • 结论与建议

1.用户在一天中,上午10点,晚上21-22点最为活跃,也是购买的两个高峰时间段,其中上午10点付费人数更多,晚上21-22点,相对于浏览量,转化率较低部分用户的行为是“逛”。对于上午10点左右的活跃用户,进行商品的精准推荐,限时降价活动,简化付费流程。对于晚上19—22点之间活跃的用户,进行多样化的商品推荐,提升用户“逛”的体验,并通过拼团促销,直播种草活动,让用户更多地将心仪商品加入购物车或收藏。

2.用户的次日留存量为20%左右,相对较低,但递减较慢,用户对于平台依赖性较强,平台发展比较稳定,可以通过会员体系,积分活动提升用户对平台的信任,并通过每日签到,会员不定期优惠活动,提高用户活跃度与留存率

3.86%的用户付费次数仅为1次,复购率0.1316,付费用户中,仅有13.16%的用户有复购行为,用户复购率低,考虑有考察周期较短的,部分用户的复购行为不在所考察的时间周期,但每天付费用户的消费次数也仅为1.1-1.2次,更多的还是用户本身复购行为较少,从用户留存率偏低也可以得到验证。

留存是复购的基础,因此可以参考提高留存率的方法,另外还可以从以下方面进行分析:产品质量,服务质量(包装,物流,售后),产品体验,这些可以从商品评论以及客服反馈得到相关数据。还可以通过问卷调研,产品试用等方式交叉排查。利用假设检验方法,提出问题,并通过数据验证,得出引起复购率低的原因,再针对性解决

4.购买次数前200名用户中,男性用户占比较高,会员等级较高的用户占比较高,需要重点关注:①等级较高,年龄较大的用户购买力高,是重要的价值用户,可以对这类用户做好针对于会员的专属活动,进一步加强用户忠实程度;②中年女性关注商品质量,同时也关注价格,可以根据用户搜索和浏览行为,精准推荐用户青睐的商品,并适时推出折扣活动;③城市等级较低的用户,消费水平相对较低,对于价格比较敏感,对这类用户,拼团活动,限时秒杀等促销活动,可以较好地促进其消费;④年龄等级较低的男性用户,这类用户一般对某品类商品有偏好,同时价格敏感度较低,有冲动消费倾向,对于这类用户,精准推荐商品,并做好详情页的展示,以及简化付费流程。

5.浏览量和购买量最高的商品品类7,34,27,81,69,75,34,20,56,其中品类7的商品浏览量最高,但浏览购买转化率很低,仅为2.3%,还有部分商品转化率为0, 需要进一步分析原因,购买量前10的商品所属的品类较为分散,说明每个品类中都有其畅销款,用户的需求也比较分散。

因此,在选品时,优先考虑浏览和购买排名前10的品类,并分析转化率较低的品类下商品,找到转化率低的原因

6.用户浏览商品后,,直接购买转化率最高,加入购物车多于收藏,而加入购物车后,购买转化率60%,收藏购买转化率48%,相对比较高,而通过浏览—收藏—加入购物车—购买这一路紧转化率最低,说明有消费意愿的用户,更倾向较为简单的购买流程。另外,收藏功能的使用率较低,可以通过问卷调研方式了解原因,并有针对性地进行优化。

7.根据最近一次消费时间间隔,对于近期很长时间未消费的潜在流失用户,通过短信或客户端push方式进行召回,并策划与用户特征相匹配的活动,提升用户与平台的黏性,根据消费频次,对于消费频次较低的用户,可以通过发放试用权益,优惠券等方式,提高用户的活跃度,培养其在平台购物的习惯;对于近期有消费且频次较高的高价值用户,推出VIP活动。对于所有用户,都可以在有重要的日期,如用户生日,会员日等,发送消息或专属优惠活动,用户关怀对于不同层级的用户都有一定的提升用户对平台的信任,增强黏性的作用,留存是用户购买的基础,留住用户,再在关键时间节点推出对应的运营活动,提高用户购买转化率。

sql代码:GitHub - 132101020/- 


http://chatgpt.dhexx.cn/article/cCcmZno5.shtml

相关文章

京东商城评论爬虫

一、前言 基于评论信息做情感分析模型第一步,收集数据。这里准备抓取京东商城的物品评论,大致可以分为两步。 1、获取商品id 2、获取商品评论 二、实战 接下来的代码都基于scrapy框架编写,请确保已经了解scrapy基础知识。 1、获取商品i…

京东商品及评论 数据采集

好吧,下面的爬虫是同步的,其实可以用协程来写,效率会增加很多! 对京东的商品基本信息,产品参数,商品评论进行采集 使用BeautifulSoup解析 注意:由于每个产品的评论只能采集100页,为…

爬虫京东评论+可视化

前期工作 选取一个网站,最好是教育网站,因为教育网站很少有反爬虫机制。 在网站内打开开发者工具,不同的浏览器开发者工具也不同,但都大同小异(这里使用的是谷歌)。 在开发者工具中确定你要爬虫的部分,找到我们爬取数…

京东手机评论的爬取

开篇 做论文的时候,最多接触的就是标准的数据集,几乎不需要太多的结构化处理,下载下来就是可以直接加载使用的数据,课题是有关评论分析的,但是论文针对的都是英文数据,而国内电商平台其实积累了大量的评论…

京东也做社交电商了

不知道大家有没有注意到,这两天朋友圈好像被京东商品给刷屏了, 身边不少大佬朋友都通过【芬香】在朋友圈带货。 我作为一个IT技术男,对于新出现的事物,自然也去研究了一番。下面就把我了解的信息分享给大家。 1、什么是「芬香」&a…

主存与内存

计算器内存条采用的是DRAM(动态随机存储器),即计算机的主存。我们通常所说的内存容量即指内存条DRAM的大小。 但是,严格地说,内存是包括主存与高速缓存(Cache,基于SRAM)的。可能是由于Cache相较内存条容量很小,毕竟内…

CPU/内存分析

一、概念理解 程序运作原理:一个请求发送到服务器,首先经过网卡,然后通知cpu有待处理任务,CPU去运行操作系统指令,根据请求的端口号,找到对应的应用程序代码,安排线程去处理;由于程…

linux服务器查看cpu和内存

一、服务器CPU情况 1 查看物理CPU个数 cat /proc/cpuinfo | grep "physical id" | sort | uniq | wc -l 2 查看服务器CPU内核个数 cat /proc/cpuinfo | grep "cpu cores" | uniq 3 查看虚拟机查看核数 grep processor /proc/cpuinfo|wc -l 4 查看cpu内核频…

计算机中CPU是如何与内存交互的

这篇文章主要整理了一下计算机中的内存结构,以及 CPU 是如何读写内存中的数据的,如何维护 CPU 缓存中的数据一致性。什么是虚拟内存,以及它存在的必要性。如有不对请多多指教。 概述 目前在计算机中,主要有两大存储器 SRAM 和 D…

CPU访问内存

首先我们需要一个引子,引子如下: 作为一个计算机领域的工程师,这里有一个问题:有一个10米深的水池需要测量其水深,并在计算机(或者微机)上显示测量结果,保留小数点后一位。请概要的设…

计算机cpu、寄存器、内存区别

1、寄存器是中央处理器内的组成部分。它跟CPU有关。寄存器是有限存贮容量的高速存贮部件,它们可用来暂存指令、数据和位址。在中央处理器的控制部件中,包含的寄存器有指令寄存器(IR)和程序计数器(PC)。在中央处理器的算术及逻辑部件中,包含的…

CPU、内存、磁盘性能监控

CPU监控 网络由设备、服务器、路由器、交换机和其他网络组件组成。CPU 是网络中所有硬件设备的组成部分。它负责设备的稳定性和性能。企业严重依赖网络,企业硬件的处理能力决定了网络的容量。随着 CPU 功能和硬件的快速发展,组织必须规划其容量并监控其…

内存、CPU、硬盘

目录 内存虚拟内存 硬盘扩充内存和硬盘CPUCPU 频率CPU 高速缓存CPU三级缓存缓存行 CPU-内存的工作原理 内存 内存是外存与CPU进⾏沟通的桥梁,计算机中所有程序的运⾏都在内存中进行。 内存(Memory)也称内存储器和主存储器,它用于暂时存放CPU中的运算数据…

内存、CPU、显存、GPU

底盘中经常会出现资源、算力等词语,对于里面的CPU、内存、GPU、显存,究竟是什么,这里主要对此进行一个基础认识。 一、内存 内存(Memory)也被称为内存储器,主要用来暂时存放CPU中的运算数据及与硬盘等外部存储器交换的数据。只要…

CPU 与 内存

CPU 与 内存 CPU控制器控制单元指令译码器指令寄存器 运算器ALU算数运算器逻辑运算器 寄存器L1,L2数据寄存器,程序计数器,段寄存器,通用寄存器,标志寄存器 内存 CPU 控制器 控制单元 时序控制,指令控制 …

cpu与内存的工作原理

计算机最核心的俩大部分:cpu和内存。哪它们之间有什么联系呢? 程序是在内存里运行的,程序要运行语句需要cpu发出指令给程序,程序收到指令后就会找到main方法,把执行语句的指令和需要的数据分别给cpu里的pc和registers…

cpu和内存

CPU ( Central Processing Unit )是一块超大规模的集成电路板,是计算机的核心部件,承载着计算机的主要运算和控制功能,是计算机指令的最终解释模块和执行模块。硬件包括基板、核心、针脚,基板用来固定核心和针脚&#…

CPU、内存、缓存的关系

术语解释 (1)CPU(Central Processing Unit) 中央处理器 (2)内存 内存用于暂时存放CPU中的运算数据,以及与硬盘等外部存储器交换的数据。它是外存与CPU进行沟通的桥梁,内存的运行决定…

操作系统系列——CPU和内存

操作系统作为所有程序运行的载体,了解其基本组成和运行的逻辑也是十分重要的。虽然要弄明白它的方方面面需要花很长的时间,但作为底层码弄,弄清楚与平常程序打交到的CPU、内存、磁盘等工作原理也十分重要。因此这里我将学习的过程和知识点做一…

【IC卡】终极版复卡器操作方法 ID卡读取方法

终极版复卡器操作方法 ID卡读取方法: http://rfid.polinktech.com/RFID-Toolkit/RFID%E8%AF%BB%E5%8D%A1%E5%99%A8%E6%93%8D%E4%BD%9C%E8%AF%B4%E6%98%8E.pdf 1. 放上ID卡,,显示如图界面,点击读取卡号。 2. 读取卡号后,放上新的…