数据分析实战—Video Game Sales电子游戏销售分析

article/2025/9/17 23:45:12

文章目录

  • 一、项目背景及目的
    • 1.1项目背景
    • 1.2分析目的
  • 二、数据收集与整理
    • 2.1数据来源
    • 2.2数据说明
    • 2.3理解数据
  • 三、数据清洗
    • 3.1导入数据
    • 3.2列字段重命名
    • 3.3缺失值处理
    • 3.4数据类型转换
    • 3.5异常值处理
    • 3.6保存数据为csv格式
  • 四、数据分析
    • 4.1 从总体角度
    • 4.2 从平台角度
    • 4.3从类型角度
    • 4.4从发行商角度
    • 4.5 从排行榜角度
  • 五、结论


一、项目背景及目的

1.1项目背景

vgsales是由vgchartz.com的一个刮版生成的,是电子游戏行业综合销售数据,希望通过分析电子游戏行业在全球的发展概况,产生一份综合的游戏行业报告。

1.2分析目的

从市场角度: 探究近几十年来电子游戏市场的发展趋势。
从平台角度: 探究用户最喜欢的游戏平台top10是什么,近些年的趋势有什么变化?
从类型角度: 探究用户最喜欢的游戏类型top10是什么,近些年的趋势有什么变化?
从发行商角度: 探究电子游戏发行商top10的销售情况以及近些年来的总体变化。(分别从销售额和发行量角度)
从排行榜角度: 对排行榜前100的电子游戏属性进行总结。


二、数据收集与整理

2.1数据来源

kaggle
https://www.kaggle.com/datasets/gregorut/videogamesales

2.2数据说明

数据集包含了从1980年到2020年来,发行的电子游戏销售数据。

文件名称说明包含特征特征对应中文名称
vgsales.csv电子游戏销售数据Rank、Name、Platform、Year、Genre、Publisher、NA_Sales、EU_Sales、JP_Sales Other_Sales、Global_Sales排名、游戏名、平台、发行年份、类型、发行商、NA销售额、EU销售额、JP销售额、其他地区销售额、总销售额

2.3理解数据

数据集的每一行表示一条用户行为,由排名、游戏名、平台、发行年份、类型、发行商、NA销售额、EU销售额、JP销售额、其他地区销售额、总销售额组成,并以逗号分隔。关于数据集中每一列的详细描述如下:

列名称说明
排名整数类型,序列化后的排名
游戏名字符串,游戏名称
平台字符串,该游戏发行平台名称
发行年份浮点型,该游戏发行的日期
类型字符串,该游戏的类型
发行商字符串,该游戏的发行商名称
NA销售额浮点型,小数点后有效数字为2位,该游戏北美销售额(百万)
EU销售额浮点型,小数点后有效数字为2位, 该游戏欧洲销售额(百万)
JP销售额浮点型,小数点后有效数字为2位,该游戏日本销售额(百万)
其他地区销售额浮点型,小数点后有效数字为2位,该游戏世界其他地区销售额(百万)
总销售额浮点型 ,小数点后有效数字为2位,该游戏全球销售总额(百万)。

三、数据清洗

3.1导入数据

在这里插入图片描述
导入数据,经查看,所有列字段都是有用的,无需删除。

3.2列字段重命名

在这里插入图片描述
将列字段转化为中文形式,增加可读性。

3.3缺失值处理

在这里插入图片描述总行数为16598,其中空值总行为307,发行年份和发行商存在缺失值,由于缺失数据为非数值型的,不能用平均数,中位数之类的数据清洗方法进行补全,且占比为1.8%,因此选择观察删除缺失值后数据是否出现大幅变动,决定是否对缺失值进行删除处理。
在这里插入图片描述
发现删除缺失值后,总体没有出现大幅变化,所以选择执行删除缺失值操作。

3.4数据类型转换

发行年份为float数据类型,需要更改为int数据类型。
在这里插入图片描述

3.5异常值处理

经观察,该数据集无异常数据,故无需进行异常值处理。

3.6保存数据为csv格式

在这里插入图片描述
将清洗后的数据导出为csv格式,便于之后用Power BI进行可视化分析。


四、数据分析

使用Power BI进行可视化分析并对分析结果进行展示。

4.1 从总体角度

从总体角度进行可视化分析,探究近几十年来电子游戏市场总的一个发展趋势。
在这里插入图片描述
解读:

  • 电子游戏市场起始于1980年,十多年间一直不温不火
  • 此局面在1995年开始迎来转机,电子游戏市场高速增长,一路高歌猛进,在2008年达到一个巅峰期
  • 2008年以后后由盛转衰,一路暴跌。

然后再拆解到不同地区,看电子游戏市场的销售额发展趋势:
在这里插入图片描述
解读:

  • 不同地区电子游戏市场发展趋势同整体市场趋势是一致的
  • 北美地区电子游戏市场大部分时间段均高于其他地区,从2000年开始高速增长,且增长幅度较其他区域而言更大,到2014年,与欧洲地区持平。

推测:

  • 2008年全球遭遇经融危机,经济发展受到冲击,消费能力下降,导致电子游戏市场开始萎靡,同时人们对购买新游戏卡带这类娱乐形式的欲望减少。
  • 2010年之后,科技进一步发展,pc电脑进入大街小巷,且智能手机也开始逐渐步入人们的视野,而顺应着时代的发展,游戏行业也迎来了巨大的变动,而这个时代的主角是端游和手游,这也是电子游戏销售金额在2008年以后暴跌的原因之一。

4.2 从平台角度

探究不同地区用户最喜欢的游戏平台top10是什么,近些年的趋势有什么变化?

在这里插入图片描述
解读

  • PS2是全球电子游戏销售额最高的平台。
  • 其中北美地区销售额最高的平台是X360,欧洲地区的是PS3,日本的是DS,其他地区的是PS2。

再来看看统计区间为2015年到2020年,不同地区用户最喜欢的游戏平台top10是什么,有何变化?
在这里插入图片描述
解读

  • 在2015-2020期间PS4是全球电子游戏销售额最高的平台。
  • 其中,北美地区销售额最高的平台是PS4,欧洲地区的是PS4,日本的是3DS,其他地区的是PS4。

整体趋势和近5年趋势结合来看:

  • 随着时代与游戏技术的发展,电子游戏的运行要求变得越来越高,大部分不支持最新游戏的老平台都退出了历史舞台。
  • 曾经的前十只剩下PS3,X360,PC,DS和Wii,且其市场地位也大幅滑落,仅X360能与新兴平台较量一番。

4.3从类型角度

探究用户最喜欢的游戏类型top10是什么,近些年的趋势有什么变化?
在这里插入图片描述
解读

  • 动作类(Action)是全球电子游戏销售额最高的类型
  • 其中,北美地区销售额最高的类型是动作类(Action),欧洲地区的是动作类(Action),日本的是角色扮演类(Role-playing),其他地区的是动作类(Action)

再来看看统计区间为2015年到2020年,不同地区用户最喜欢的游戏类型top10是什么,有何变化?
在这里插入图片描述
解读

  • 在2015-2020期间动作类(Action)仍然是全球电子游戏销售额最高的类型
  • 其中,北美地区销售额最高的类型变为射击类(Shooter),欧洲地区的是射击类(Shooter),日本的是动作类(Action),其他地区的是射击类(Shooter)

整体趋势和近5年趋势结合来看:

  • 最受玩家欢迎的游戏类别一直是动作类(Action),但是射击类(Shooter)超过了运动类(sports),与动作类(Action)的差距也变得很小,且在四大市场中均占据销量第一位
  • 平台游戏(Platform)是下降趋势最明显的游戏类型,平台游戏是如《超级马里奥》一样在2D水平面上使用各种方式或者跳跃(甚至滑翔)穿过障碍的游戏方式。但由于电子游戏也随着科技的进步进入了3D时代,玩家的玩法,需求等更丰富,而平台游戏难以承载如此多样化的需求进而导致其没落

4.4从发行商角度

探究电子游戏发行商top10的销售情况以及近些年来的总体变化。(分别从销售额角度和发行量角度)

我们先从销售额角度观察:
在这里插入图片描述
解读

  • 任天堂(Nintendo)是全球电子游戏销售额最高的类型
  • 其中,北美地区销售额最高的类型是任天堂(Nintendo),欧洲地区的是任天堂(Nintendo),日本的是角色扮演类任天堂(Nintendo),其他地区的是美国艺电(Electronic Arts)

接着我们观察2015-2020期间各发行商的发行量:
在这里插入图片描述
发行量与销售额结合来看:

  • 美国艺电总得游戏发行量位列第一,而任天堂仅位为第7,但是任天堂的销售额却稳居第一,可以认为任天堂发行的游戏质量十分之高,受到玩家的高度喜爱
  • 万代南梦宫(Bandai Namco Games)却与任天堂恰好相反,其发行量位列第三,仅稍次于动视(Activision),而其销售额仅为第十,不到任天堂的15%,可以猜测其游戏相较于销售额前10的其他游戏发行商,在玩家中的人气略低
  • 其他游戏发行商的发行量与销售额基本呈正相关

再来看看统计区间为2015年到2020年,不同地区最受欢迎的发行商top10是什么,有何变化?
我们先从销售额角度观察:
在这里插入图片描述
解读

  • 在2015-2020期间美国艺电(Electronic Arts)是全球电子游戏销售额最高的类型
  • 其中,北美地区销售额最高的类型是是美国艺电(Electronic Arts),欧洲地区的是是美国艺电(Electronic Arts),日本的是角色扮演类任天堂(Nintendo),其他地区的是美国艺电(Electronic Arts)

2015-2020期间发行量:
在这里插入图片描述
发行量与销售额结合来看:

  • 可以看出万代南梦宫(Bandai Namco Games)的市场策略仍主打游戏发行量,几乎是发行量排名第二的动视(Activision)的一倍,而销售额却仅仅位列第六,不到销售额排名第一的美国艺电(Electronic Arts)的四成
  • 近些年美国艺电(Electronic Arts)的游戏质量提升,在玩家中的口碑不错
  • 任天堂近些年稍显颓势

4.5 从排行榜角度

最后我们对排行榜前100的电子游戏属性进行一个总结,观察销售额前100的游戏具有怎样的特征。
在这里插入图片描述
解读:

  • Top100的游戏中,来自任天堂发行的游戏占63%,可以说明其霸主地位无可撼动
  • Top100的游戏中,横版平台游戏(Platform)、射击类游戏(Shooter)和角色扮演类游戏(Role-playing)占据半壁江山
  • Top100的游戏中,玩家更多的集中在Wii,DS,X360三个平台

五、结论

  1. 受2008年金融危机影响,以及pc游戏和手游的冲击,电子游戏从1995年开始蓬勃发展,在2008年达到一个巅峰,此后开始一路走弱,呈现大幅度的下滑。
  2. 北美是电子游戏的主力市场,其购买力是最强的,其次是欧洲。
  3. 整体来看,PS2是最受玩家欢迎的平台,但目前已被PS4所取代。
  4. 动作游戏一直是玩家最喜爱的游戏类型,其次是射击类和运动类。
  5. 占据头部市场的发行商变化不大,整体看来任天堂是最受玩家欢迎的发行商,其经典游戏在玩家中的地位不可撼动,但近些年稍显颓势,其新发行的游戏对玩家吸引力稍显不足。
  6. Top100的游戏中,一大半来自于任天堂发行,多为横版平台游戏(Platform)、射击类游戏(Shooter)和角色扮演类游戏(Role-playing), 玩家集中在Wii,DS,X360三个平台。

初涉数据分析,如有不足之处还望不吝指教~


http://chatgpt.dhexx.cn/article/r2uLLWbu.shtml

相关文章

Python | 英雄联盟游戏数据分析

一、项目背景 EDG夺得2021英雄联盟全球总决赛冠军,这场比赛让所有观赛者热血沸腾,也唤起了我这个沉睡多年老玩家对MOBA游戏的兴趣,兴冲冲地下载了英雄联盟,却发现这并不是一个可以轻松上手的游戏。 对于时下最流行的MOBA类游戏—…

【毕业设计】大数据 - 网络游戏数据分析可视化

文章目录 1. 数据集说明2. 数据处理3. 数据分析可视化3.1 新增用户3.2 用户活跃度3.3 用户消费情况3.4 用户游戏情况 4 最后 🧿 选题指导, 项目分享: https://gitee.com/dancheng-senior/project-sharing-1/blob/master/%E6%AF%95%E8%AE%BE%E6%8C%87%E5…

游戏数据分析方法-活跃向

许多公司都会做数据分析系统。而不同游戏产品,一个产品的不同阶段,不同版本所分析的内容都是会跟进实际需求而不一样的。所以除了一些通用的数据指标外,针对不同的问题,分析方法也不一样,这里举几个案例来展示一般的数…

电子游戏数据分析报告

数据分析报告结论: 1.时间维度分析,从全球各地区的销售额变化趋势来看,全球销售额整体是从1980年开始逐步上升直到2008年达到销量顶峰后逐步降低,2008年后直接逐步下降,局部在2000年及2003年都有稍有下跌,…

python游戏数据分析

python游戏数据分析 数据分析思维导图 1.项目背景简介 本次项目分析所用数据集来源于kaggle steam游戏各地区销售数据,可以通过不同国家、发布者、游戏类型,地区收益等因素,对销售数据进行分析,提出有效的建议,帮助…

游戏数据分析小总结

数据分析步骤 明确要求 数据收集 企业内部数据 企业外部数据 数据处理 数据分析 数据分析即用适当的数据分析方法及工具,对处理过的数据进行分 析,提取有价值的数据,形成有效结论的过程。常用的分析方法有对比分析法、分组分析法、结构…

《游戏数据分析实战》总结思考

对于一个游戏行业的门外汉,这本书对于了解游戏业务具有很强的指导性,通过大量的案例说明了游戏这一具有特殊行业逻辑的行业,如何针对性地进行数据分析。 一、游戏关键数据指标 1、转化率——从点击广告到付费的每一步转化(常使用…

【数据分析项目实战】篇1:游戏数据分析——新增、付费和用户行为评估

目录 0 结论 1 背景介绍 1.1 游戏介绍 1.2 数据集介绍 2 分析思路 3 新增用户分析 3.1 新增用户数: 3.2 每日新增用户数: 3.3 分析 4 活跃度分析 4.1 用户平均在线时长 4.2 付费用户平均在线时长 4.3 日活跃用户(日平均在线时长…

游戏的数据和分析

一、关于数据 数据可以分为两类,一类为运营指标数据。一类为业务行为数据。 1.运营指标数据 比如DAU,PCU,LTV,ROI等常用的代表游戏目前线上运营状态的一些数据指标,用单个指标或者多个指标组合来反映游戏目前的线上运营状态,指标之间一般都有…

游戏数据分析

游戏数据分析 学习目标 知道游戏行业关键数据指标掌握ARPU, ARPPU等指标的计算方法 一、游戏行业关键数据指标 1.1 运营数据 激活数据 总激活码发放量、总激活量、总登录账号数激活率、激活登录率 激活率 激活量 / 安装量(激活码的)激活率 激活量 / 激活码发放…

游戏数据分析 | 用户流失原因分析

流失用户分析的方法有很多,常见的方法有流失等级分布、 等级停滞率、分渠道和平台的留存率对比、主线任务持有率。本文将从合理定义流失用户、客户端卸载原因和5W1H分析法来分析流失用户,并且用聚类分析对活跃用户进行细分,其目标在于更好地了…

Google Play Store谷歌应用商店游戏数据分析

数据集:Google Play Store Apps 网址:https://www.kaggle.com/lava18/google-play-store-apps?selectgoogleplaystore.csv 此数据集包含了两个csv文件,一个是Google play store app的整体数据,一个是Google play store用户评论的…

Vue向下滚动加载更多数据-scroll-案例

vue-infinite-scroll 安装 npm install vue-infinite-scroll --save尽管官方也推荐了几种载入方式,但“最vue”的方式肯定是在main.js中加入 import infiniteScroll from vue-infinite-scroll Vue.use(infiniteScroll)实现范例 官方给的代码范例是假设你在根组件…

jQuery 上拉加载更多

上拉加载,当用户浏览到页面底部时候,自动加载下一页的内容 不管是上拉加载还是下拉刷新,其实都离不开一个关键的事件:滚动条滚动事件。 本demo是窗口的滚动条事件,如果需要指定某个元素做上拉加载功能,请手…

uniapp实现上拉加载更多

目录 一、添加全部 1.在主页面中添加一列 2.改云函数 3.插件市场导入 加载中组件 二、实现上拉加载 1.云函数中可以接收参数 2.获取下拉事件 3.写触发这个下拉干嘛 在 显示加载中的组件里面 一、添加全部 1.在主页面中添加一列 data.unshift({name:全部}) //添加一列 …

element-ui,实现点击“加载更多“

首先&#xff0c;实现的大概效果如下&#xff1a; 接下来代码如下: <el-dialog v-el-drag-dialog title"预览" :visible.sync"dialogFormPreview" width"500px" ><div v-for"item in logList.slice(0,loadNum)" :key"i…

史上最全的使用RecyclerView实现下拉刷新和上拉加载更多

前言&#xff1a; 纵观多数App&#xff0c;下拉刷新和上拉加载更多是很常见的功能&#xff0c;但是谷歌官方只有一个SwipeRefreshLayout用来下拉刷新&#xff0c;上拉加载更多还要自己做。 本篇文章基于RecyclerView简单封装了这两个操作&#xff0c;下拉刷新支持LinearLayoutM…

一种Flutter加载更多的实现方法

转载注明出处&#xff1a;https://blog.csdn.net/skysukai 1、why flutter&#xff1f; 我们在进行Android开发的时候&#xff0c;比如布局文件&#xff0c;会创建一个xml来存放布局。写熟悉了觉得没什么&#xff0c;可是&#xff0c;用xml来存放布局文件是十年前的技术了。在…

Android BaseRecyclerViewAdapterHelper上拉加载更多

private boolean isErr false; //是否加载错误 private int TOTAL_COUNTER 16; //一共模拟加载16条数据&#xff0c;所有的数据总数 private int mCurrentCounter 6; //当前的数据总数&#xff0c;因为第一次默认加载6个//1.上拉加载mImgDetailsAdapter.setOnLoadMoreListen…

使用SmartRefreshLayout下拉刷新框架实现加载更多

使用 SmartRefreshLayout 可以实现recyclerview的下拉刷新和上拉加载更多&#xff0c;但是有时候在使用上拉加载更多时&#xff0c;不同的json格式需要不同的判断方法 1、后台根据每次相加的totalElements的个数作为请求的参数即pageSize12 pageNo1 {"content":[{…