【Python数据分析与处理 实训02】 ---2012欧洲杯信息分析(数据过滤与排序)

article/2025/10/31 9:58:57

【Python数据分析与处理 实训02】 —2012欧洲杯信息分析(数据过滤与排序)


探索2012欧洲杯信息

对于下面的数据集进行简单的一些数据的分析训练
在这里插入图片描述

若需要源数据请私信~


读取数据

euro12 = pd.read_csv("G:\Projects\pycharmeProject\大数据比赛\泰迪智能科技\data\Euro2012.csv",sep=",",index_col=0)
print(euro12.head(10))

通过给定的数据集,可以发现原始数据中的第一列为team,第一行为字段列名,可以在读取的时候加入index_col=0可将第一列在读取时看成行名,这样数据集就变成每一个队伍的欧洲杯数据,当然也可以不使用该参数,根据具体情况来看。

在这里插入图片描述


1.将数据写出成一个excel文件

euro12.to_excel('G:\Projects\pycharmeProject\大数据比赛\泰迪智能科技\data\Euro12.xls')

通过to_excel()可以将结果集保存为excel表格

在这里插入图片描述


2.只选取Goals这一列。

print(euro12['Goals'])

在这里插入图片描述


3.有多少球队参与了2012欧洲杯?

print(euro12['Team'].nunique())

之前统计的时候,我们都使用unique先进行去重操作,然后再进行取size,今天介绍一个新方法nunique()n代表了个数number,可以直接获取去重数据后的个数

在这里插入图片描述


4.该数据集中一共有多少列(columns)?

print(euro12.shape[1])

在这里插入图片描述


5.将数据集中的列Team, Yellow Cards和Red Cards单独存为一个名叫discipline的数据框。

discipline = euro12[['Team', 'Yellow Cards', 'Red Cards']]         # 方式一
print(discipline)
discipline = euro12.loc[:, ['Team', 'Yellow Cards', 'Red Cards']]  # 方式二
print(discipline)

单独存为一个名叫discipline的数据框,简单的说就是提取所需要的有效列,可以通过切片的方式提取列后赋予一个新的变量来实行。

在这里插入图片描述


6.对数据框discipline按照先Red Cards再Yellow Cards进行排序。

print(discipline.sort_values(['Red Cards', 'Yellow Cards'], ascending=False))

排序操作,sort_values中参数传入要进行排序的列,当有多个列的时候使用[]包含起来

在这里插入图片描述


7.计算每个球队拿到的黄牌数的平均值。

print(discipline.groupby('Team').agg({'Yellow Cards': 'sum'}).mean())

在这里插入图片描述


8.找到进球数Goals超过6的球队数据。

index1 = euro12['Goals'] > 6
print(index1)
print(euro12.loc[index1, :])   # 数据框的第四种索引方式:根据逻辑值进行访问

在这里插入图片描述

9. 选取以字母G开头的球队数据。

isG = euro12['Team'].str[0] == "G"
print(isG)
print(euro12.loc[isG,:])

在这里插入图片描述


10. 选取前7列。

print(euro12.iloc[:,0:7])

在这里插入图片描述

在这里插入图片描述


11. 选取除了最后3列之外的全部列。

print(euro12.iloc[:,:-3])

在这里插入图片描述

在这里插入图片描述


12.找到英格兰(England)、意大利(Italy)和俄罗斯(Russia)的射正率(Shooting Accuracy)。

# 方法一
a = (euro12['Team'] == "England") | (euro12['Team'] == "Italy")  | (euro12['Team'] == "Russia")
print(a)
print(euro12.loc[a,"Shooting Accuracy"])

对于逻辑访问的应用 ,首先筛选出符合条件逻辑。然后再查询Shooting Accuracy。

在这里插入图片描述

# 方法二
euro12.set_index('Team',inplace=True)
print(euro12.loc[['England','Italy','Russia'],'Shooting Accuracy'])

我们还可以使用直接提取的方式,但是首先要做一个转变,就是将Team列设定为index,上面一种方法实际上在查询的时候,也是按照逻辑值为true的index去查询的,所以在这里,使用第二种方法,我们直接将Team列设为行索引去查询。

在这里插入图片描述



http://chatgpt.dhexx.cn/article/BBrKuaJ8.shtml

相关文章

【SQL语法基础】数据过滤:SQL数据过滤都有哪些方法?

我在上篇文章中讲到过,提升查询效率的一个很重要的方式,就是约束返回结果的数量,还有一个很有效的方式,就是指定筛选条件,进行过滤。过滤可以筛选符合条件的结果,并进行返回,减少不必要的数据行…

若依ruoyiAOP切面用于数据过滤和权限处理实例

目录 1.什么是AOP 简介 2.若依的AOP实现 2.1若依数据过滤AOP 定义注解 实现切面类 2.2数据源AOP 1.什么是AOP 简介 AOP为Aspect Oriented Programming的缩写,意为:面向切面编程,通过预编译方式和运行期间动态代理实现程序功能的统一…

FineReport-数据过滤权限设置

目的本省份的人只能看到某表单属于该省份的数据 安徽只能看到安徽的数据 一、在数据库中建立一张权限对应表,该表字段包含帆软登录用户名、省份名称即可 二、在帆软报表模板数据集中设置过滤 select * from table1 t1 left join table2 t2 on t1.MZt2.USERNAME w…

布隆过滤器(亿级数据过滤算法)

介绍 我们以演进的方式来逐渐认识布隆过滤器。先抛出一个问题爬虫系统中URL是怎么判重的?你可能最先想到的是将URL放到一个set中,但是当数据很多的时候,放在set中是不现实的。 这时你就可能想到用数组hash函数来实现了。 index hash(URL)…

Pandas的数据过滤

作者|Amanda Iglesias Moreno 编译|VK 来源|Towards Datas Science 从数据帧中过滤数据是清理数据时最常见的操作之一。Pandas提供了一系列根据行和列的位置和标签选择数据的方法。此外,Pandas还允许你根据列类型获取数据子集,并使用布尔索引筛选行。 在本文中,我们将介绍…

数据过滤:SQL数据过滤都有哪些方法?

我在上篇文章中讲到过,提升查询效率的一个很重要的方式,就是约束返回结果的数量,还有一个很有效的方式,就是指定筛选条件,进行过滤。过滤可以筛选符合条件的结果,并进行返回,减少不必要的数据行…

数据过滤(MySQL)

数据过滤 数据过滤用在WHERE表达式里,常用的有基本查询过滤、条件查询过滤、模糊查询过滤、字段查询过滤以及正则表达式查询过滤。 一、基本查询过滤 基本查询过滤可以查询所有字段数据或指定一个字段或者多个字段的数据。 附带建表 mysql> create table use…

掌握这些数据过滤的技巧,再复杂的业务数据也能高效处理!

随着互联网的飞速发展,呈爆炸式增长的数据使用户逐渐迷失在了信息的海洋之中,在进行数据分析时,海量的业务数据往往会带来一些问题: 准确性差:无效数据以及无需进行分析的数据混杂在其中,导致分析结果与实际…

阿里云服务器初始化

初始化阿里云服务器 进入阿里云服务器,然后在 配置信息 点击 重新初始化磁盘 接着会出现一个提示框,点击 确认 即可 进入实例云盘中,点击 重新初始化磁盘 然后设置密码 完成这一步后,输入手机验证码。这时阿里云服务器就被初始…

腾讯云服务器如何开启虚拟化,腾讯云服务器虚拟化驱动是什么

腾讯云服务器虚拟化驱动是什么? 云服务器虚拟化驱动,为腾讯自研开发,专门用于虚拟化效率提升的驱动程序,云服务器虚拟化驱动在linux系统中驱动文件名是pvdriver,安装路径:/usr/local/qcloud/pvdriver/bin,在…

金山办公CEO章庆元:数字化、云化、订阅化趋势下,组织数字办公走向纵深

关注ITValue,看企业级最新鲜、最价值报道! 企业办公行业今年有3个关键词——数字化、云化、订阅化。 从数字化来说,国家十四五规划明确提出了“加快建设数字经济、数字社会、数字政府,以数字化转型整体驱动生产方式、生活方式和治…

物联网端-云一体化应用管理解决方案

近年来,随着云计算的发展,“云边端一体化”、“云端协同”等词也频繁出现在大众眼。 什么是“端-云一体化”? 这里我们拆开来解释: 云:云计算、云数据中心; 端:指的是终端。 合起来的意思就是…

CloudCore引领核心网云化转型

文/刘皓 2015年7月,全球著名咨询公司IHS Infonetics发布最新NFV(Network Functions Virtualization,网络功能虚拟化)市场调研报告。报告显示,NFV市场空间将从2014年的9.5亿美元增长到2019年的116亿美元,年…

全面推进云化,使能数字化转型 ——徐直军在2016华为全球分析师大会上的发言

文/徐直军 女士们、先生们,各位老朋友、新朋友,大家上午好!非常高兴在同样的地点跟各位老朋友再相会,也非常欢迎各位新朋友来参加华为2016年的分析师大会。 这次大会的组委会给我定的主题是《全面推进云化,使能数字化转…

阿里云人物动漫化

简介 使用阿里云人物动漫化功能制作一款属于自己的专属头像(该功能收费) 功能描述 人物动漫化能力可以将一张人物图像进行转换处理,生成二次元卡通形象,并返回动漫化后的结果图像。效果示例如下。 原图: 日漫风结果图: 3D特效结…

服务器虚拟化与云平台,虚拟服务器和云有哪些区别

原标题:虚拟服务器和云有哪些区别 虚拟服务器和云有哪些区别?如果不是专业的人员,其实对于服务器是搞不懂的,其实虚拟服务器和云都是对硬件的抽象,两者都有很多好处和使用的理由,那么服务器虚拟化和云的区别…

腾云忆想构建云化IT生态,助力我国“双循环经济”数字化升级

新冠肺炎疫情全球蔓延,世界经济与国际局势瞬息万变。时局变化之中展望“十四五”,我国逐步形成了以国内大循环为主体、国内国际双循环相互促进的新发展格局。在新时局中,数字经济是重要的支撑力量,产业的数字化转型成为不可逆的趋势。 面对时代变局,腾云忆想紧抓历史机遇,与腾…

欢迎参与2020年云栖大会——引领企业基础设施云化

**简介:**2020年9月18日,阿里云邀您参加2020年云栖大会——引领企业基础设施云化分会场。 2020年9月18日,阿里云邀您参加2020年云栖大会——引领企业基础设施云化分会场。 在数字新基建时代,IT基础设施成为企业数字化转型的一个瓶…

何朝曦:构建云化安全能力的三个建议

11月12日,深信服智安全创新峰会在云端拉开帷幕,深信服创始人&CEO何朝曦在《构建云化时代的安全能力》主题演讲中指出,业务云化已成为用户实现数字化转型与变革的重要方式,这种跨时代的变迁对用户的安全能力提出了更高的要求&a…

英特尔TCI技术落地,锐捷网络发布OCS终端云化新品

编辑 | 宋慧 出品 | CSDN 云计算 2021 年 6 月,国内一直深耕桌面虚拟化的厂商锐捷正式发布了新一代云桌面解决方案——锐捷三擎云桌面解决方案( “精耕细作”桌面云市场的锐捷,重磅发布三擎云桌面 ),其中三擎指的是终端…