Kindle产品评论数据分析---基于excel的分析过程

article/2025/10/13 1:08:51

目录

业务背景

一)明确分析目的

二)数据采集

三)数据清洗

四)数据分析与构建模型

1、相关产品的评论数排名和平均评分反映的问题

2、各评论占比,推荐评论中好评占比

3、kindle相关产品随时间变化其评论数的变化情况

4、kindle相关产品的优点,对评论内容生成词云

五)总结与建议


业务背景

对于用户:在购买kindle产品时,查看Kindle产品的相关评论,做出决定;

对于企业:可以通过kindle评论,了解用户对kindle的真实体验,针对性改进产品。

一)明确分析目的

1、kindle相关产品的评论数和评分

2、kindle产品的好评和差评占比,推荐评论占比

3、kindle评论数随时间(年份/月份)变化情况

4、kindle产品的优缺点

5、kindle产品受好评的原因

6、结论与业务建议

二)数据采集

slsConsumer Reviews of Amazon Products | Kaggle

三)数据清洗

1、选择子集

1)隐藏与分析问题无关的列

2)选择需要的行

在categries列中进行数据-筛选-包含-"Kindle",进行数据筛选

2、重命名

将英文名重命名为中文名称

3、删除重复值

根据评论时间、评分、评论文本三列的内容判定是否重复,进行去重操作。

4、缺失值处理

筛选产品名、产品类别、评论时间、评分,将空值行删除

评论标题和评论内容可以为空值

5、一致化处理

1)将评论日期拆分为年、月、日三列

用LEFT函数提取年份

用MID和FIND函数提取月份

用MID和FIND函数提取日期

2)对评论分数进行分组(0--3分为差评,4--5分为好评)

IF(D2<=3,"差评",“好评”)

四)数据分析与构建模型

1、相关产品的评论数排名和平均评分反映的问题

利用数据透视表对产品评论进行分析。

(1)统计评论数,并按高低排名,评论数越多,说明该产品销量越多。通过产品评论数可以大概了解产品的销售情况,如图:(Amazon Kindle Paperwhite - eBook reader - 4 GB - 6 monochrome Paperwhite - touchscreen - Wi-Fi - black)产品的评分数量最多,说明这款产品的销量最好。

前三名产品的评论数量差别不大,从第四名开始评论数量骤减,相比第一名减少5倍多,这说明kindle类产品容易出现积聚效应,大多数人或跟风或有目的性的喜欢特定的两三款产品。

(2)各产品平均评分。如折线图所示,各产品的平均分都在3分以上,说明kindle类产品的总体评价较高,有个别产品的评论数少的,可能是其产品知名度较低或者有明显的缺点。

2、各评论占比,推荐评论中好评占比

各评分的占比

好评数量与差评数量的占比

如图所示,好评占比高达95.43,反映了绝大多数用户都对kindle的使用感到满意

3、kindle相关产品随时间变化其评论数的变化情况

(1)总评论数随时间变化的趋势,如图所示,kindle产品的总评论数逐年增长,从2015年开始快速变化,剧增到6000多。

(2)各类产品评论数随时间变化的趋势,有关kindle产品的产品种类在2015年快速上升

(3)对15、16、17年进行逐月分析:

如图所示,评论数量从15年开始逐渐增加,在16年12月达到顶峰

如图所示,kindle销售主要集中在11、12和1月,结合实际,在每年11、12、1月是国内各大电商平台进行活动促销的时段

4、kindle相关产品的优点,对评论内容生成词云

由上图可知,Oasis(钢化膜)、Cover(封面)、Light(光线)、、运行流畅(worksgreat)这些字样特别明显,这说明消费者喜欢该类产品的原因是它轻便小巧、电池寿命长、运行流畅、价格实惠、封面漂亮,但是缺点是屏幕易碎,需要贴膜。

五)总结与建议

1、总结

.Kindle产品总体评分比较高,但评论数排名前3和排名第4名起其数目差距比较大,大部产品只有少数评论数,绝大部分用户只喜欢特定的两三种产品。

·Kindle商品深受消费者喜爱,好评度很高。

.Kindle产品在每年10、11月和12月评论数急剧增长,应加大宣传销售手段,刺激增长销售额。

Kindle产品广受好评的主要原因是:其产品特点轻便小巧、电池寿命长、运行流畅、价格实惠、封面漂亮。

2、建议

将最受欢迎的三种产品作为主打商品,分别是

Amazon Kindle Paperwhite-eBook reader-4 GB-6 monochrome Paperwhite -

touchscreen-Wi-Fi-black

Echo(White)

Amazon Fire Tv

建议利用商品使用、性能及价格的优势作为主要宣传手段,在黄金时期(11、12、1月),加大宣传力度,刺激产品销售,提高销售量


 


http://chatgpt.dhexx.cn/article/ZdeAPc9B.shtml

相关文章

数据挖掘HeartbeatClassification——数据分析

如同计算机视觉中一样&#xff0c;在训练目标识别的网络之前&#xff0c;会对图片进行预处理&#xff0c;如 裁切&#xff0c;旋转、放大缩小&#xff0c;以加强网络的泛化能力。在数据挖掘中&#xff0c;我们首先要做的就是对拥有的数据进行分析( 涉及到《概率论与数理分析》的…

javaScript数据可视化

文章目录 canvas画布介绍绘制线段起始点设置其他点设置&#xff08;可以有多个&#xff09;划线方法 属性填充线段颜色线段宽度线段例子 绘制矩形第一种方式&#xff1a;第二种方式矩形例子 绘制圆形圆形例子 清除画布清除例子 绘制文字属性 svg介绍&#xff1a;基本的svg元素例…

Python交互式数据分析报告框架:Dash

译者序 原文于2017年6月21日发布&#xff0c;时过半载&#xff0c;将这篇既不是教程&#xff0c;也不是新闻的产品发布稿做了一番翻译&#xff0c;为何&#xff1f;只因去年下半年的时候&#xff0c;用R语言的博哥和龙少有Shiny这样的框架可以开发交互式整合Web数据分析报告&am…

【数据可视化】免费开源BI工具 DataEase 之血缘关系分析

近期&#xff0c;DataEase 发布的版本 V1.8 版本中&#xff0c;在系统管理模块新增了血缘分析功能&#xff0c;可以支持对数据源、数据集、仪表板做关联分析&#xff0c;支持按表格查看和按关系图查看&#xff0c;并且在删除数据源、数据集时&#xff0c;也支持查看对应的血缘分…

数据分析与数据可视化的完成,需要了解一下这四款JS库

四款出色的JavaScript库&#xff0c;帮助大家更为轻松地完成数据分析与可视化工作&#xff0c;具体如下&#xff1a; Data-Driven-Documents (D3.js) 在讨论JavaScript数据分析时忽略掉Data-Driven-Documents (D3)&#xff0c;就如同在谈论微软时忽略掉其操作系统 样。 Data-D…

数据挖掘之关联分析(实验展示以及源代码)

数据挖掘之关联分析 算法实现&#xff1a;Apriori算法和FP-growth 算法源代码 简单描述下&#xff0c;关联分析概念 关联分析概念主要参考下面的博文 原文&#xff1a;https://blog.csdn.net/qq_40587575/article/details/81022350 关联分析是从大量数据中发现项集之间有趣的…

【数据分析入门】python数据分析-探索性数据分析之多因子与对比分析可视化

文章目录 多因子与对比分析可视化理论基础假设检验与方差检验假设检验方差检验 相关系数:皮尔逊、斯皮尔曼回归:线性回归PCA与奇异值分解 代码实践交叉分析分组分析相关分析因子分析 总结代码实现 相关性线性回归PCA注意&#xff1a;sklearn中pca用的方法是奇异值分解的方法&am…

数据分析系列之挖掘建模

经过数据探索与数据预处理,得到了可以直接建模的数据,根据挖掘目标和数据形式可以建立分类与预测,聚类分析,关联规则,时序模式和偏差检测等模型,帮助企业提取数据中的商业价值. 分类与预测 对于之前的背景假设,餐饮企业会经常遇到如下问题: 如何基于菜品历史销售情况,以及节…

【大数据分析与挖掘】挖掘建模之关联分析

文章目录 一、关联规则1.1 常用的关联规则算法1.2 Apriori算法介绍1.2.1 关联规则与频繁项集1.2.2 Apriori算法的思想与性质1.2.3 Apriori算法的实现的两个过程1.2.4 Apriori算法的实现案例 一、关联规则 关联规则分析也成为购物篮分析&#xff0c;最早是为了发现超市销售数据…

Hands-on-data-analysis 动手数据分析

动手数据分析笔记 第一章 第一节 数据载入及初步观察 数据载入 df pd.read_csv(file_path)df2 pd.read_table(file_path)read_csv 函数 见CSDN 博客&#xff1a; https://blog.csdn.net/weixin_39175124/article/details/79434022 问&#xff1a;read_csv 和 read_table …

python数据分析-因子分析(转载)

python数据分析-因子分析&#xff08;转载&#xff09; &#xff08;获取更多知识&#xff0c;前往前往我的wx ————公z号 &#xff08;程式解说&#xff09; 原文来自python数据分析-因子分析

ThreeJs 数据可视化学习扫盲

一&#xff1a;前言 数据可视化是一个跨领域的行业&#xff0c;其中包含了图形学、数学、视觉传达等专业领域。 下图罗列出了一个简单的学习方向。 二&#xff1a;可视化方案以及学习路线 目前采用的是比较成熟&#xff0c;社区活跃度更高的Three.js&#xff0c;它是一个开源…

数据处理以及Hive数据分析

数据处理以及Hive数据分析 一、pandas进行数据预处理【1】待处理的一部分数据【2】原始数据文件的格式说明【3】数据预处理要求【4】 处理完成的数据字段说明【5】 实验方法使用pandas进行数据预处理 【6】解析题意【7】代码展示&#xff08;1&#xff09;读取文件&#xff08;…

Python交互式数据分析报告框架~Dash介绍

原文作者&#xff1a;Plotly,Chris Pamer 原文链接&#xff1a; https://link.jianshu.com/?thttps%3A%2F%2Fmedium.com%2F%40plotlygraphs%2Fintroducing-dash-5ecf7191b503 译者序&#xff1a;原文于2017年6月21日发布&#xff0c;时过半载&#xff0c;将这篇既不是教程…

CESI: Canonicalizing Open Knowledge Bases using Embeddings and Side Information

开放性知识库的规范化&#xff08;个人理解&#xff1a;这里的规范化实际上就是将相同语义的实体或关系聚集在一起&#xff0c;从而表示一个实体或关系&#xff09;&#xff0c;主要是OPENie提取的过程中没有进行区分&#xff0c;最近的研究发现&#xff0c;开放KBS的规范化实际…

计算机一级仿宋gb2312,仿宋gb2312字体

一般情况下&#xff0c;这款软件在试用的过程可能还有点小问题&#xff0c;但是正所谓瑕不掩瑜&#xff0c;相信用不了多久&#xff0c;只要程序猿给力点&#xff0c;这种小小的反馈不爽就可以解决。 仿宋gb2312字体字体简介 仿宋_GB2312字体是印刷字体的一种 &#xff0c;仿照…

Supervisor部署(离线部署需要提前下载部署包)

1.软件准备 下载tar包&#xff1a;wget https://pypi.python.org/packages/source/s/supervisor/supervisor-3.1.3.tar.gz 解压&#xff1a;tar -xvf supervisor-3.1.3.tar.gz 进入解压包&#xff1a;cd supervisor-3.1.3 开始安装&#xff1a;python setup.py install 下载me…

Docker 学习之 Docker 容器数据卷

容器数据卷 什么是容器数据卷 docker 理念回顾 将应用和环境打包成一个镜像&#xff01; 问题&#xff1a;数据&#xff1f;如果数据都在容器中&#xff0c;那么我们删除容器&#xff0c;数据就会丢失&#xff01;需求&#xff1a;数据可以持久化&#xff01; 容器之前可以…

Supervisor 安装与配置

文章目录 Supervisor 安装与配置一、介绍二、名词释义三、Supervisor 安装三、Supervisor 配置四、启动控制终端五、注册为系统服务六、管理界面1、管理界面的弊端 Supervisor 安装与配置 一、介绍 ​ Supervisor 是用Python开发的一个 client/server 服务&#xff0c;是Linu…

使用Cesi+Supervisor实现进程管理

使用CesiSupervisor实现进程管理 相信很多的运维小伙伴都是饱受进程丢失的痛苦&#xff0c;最怕半夜被手机吵醒&#xff0c;那一定是经理想你 不管进程是前台运行还是后台静默运行&#xff0c;我们都需要能监控其进程状态。 原因有三&#xff1a; 一&#xff0c;在意外结束时…