UCI——心脏病数据集分析报告

article/2025/10/11 7:14:26

文章目录

  • 1 前期准备
    • 1.1 安装数据分析+可视化第三方工具包
    • 1.2 安装辅助工具包
    • 1.3 安装机器学习第三方工具包
    • 1.4 安装机器学习可解释性第三方工具包
  • 2 对于数据集进行导入、查看及简单分析
    • 2.1 代码及注释
    • 2.2 简单分析属性的相关系数关系

写在前面:研一的机器学习课程需要针对UCI的一个数据集进行分析。所以就有了这篇文章。也是第一次好好学习机器学习了。

[P5]

1 前期准备

本次实验基于spyder,python3.7,数据集 heart.csv

1.1 安装数据分析+可视化第三方工具包

  1. 首先打开anaconda prompt,然后输入下面一行代码即可。
pip install numpy pandas matplotlib seaborn wheel pandas_profiling jupyter notebook -i https://pypi.tuna.tsinghua.edu.cn/simple
  1. 介绍一下每一个库
  • Numpy:是python语言的一个扩展程序库;支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。
  • pandas:是python语言的一个扩展程序库;用于数据分析;可以从各种格式文献比如CSV、JSON、SQL、Microsoft Excel导入数据。
  • matploylib:是python在绘图领域最常用的套件。它能让使用者很轻松地将数据图形化,并且提供多样化的输出格式。
  • seaborn:是基于matplotlib的图形可视化python包。它可以让用户能够做出各种有吸引力的统计图表。
  • wheel:取代了之前的打包格式.egg文件。
  1. 最后是清华大学的镜像网站,是为了加速下载的。https://pypi.tuna.tsinghua.edu.cn/simple

1.2 安装辅助工具包

pip install graphviz pydotplus -i https://pypi.tuna.tsighua.edu.cn/simple

将graphviz的bin目录加在环境变量PATH中。
在这里插入图片描述

1.3 安装机器学习第三方工具包

pip install scikit-learn -i https://pypi.tunasinghua.edu.cn/simple

1.4 安装机器学习可解释性第三方工具包

pip install pdpbox eli5 -i https://pypi.tunasinghua.edu.cn/simple

2 对于数据集进行导入、查看及简单分析

2.1 代码及注释

import pandas as pd
df = pd.read_csv("heart.csv")
print(df.head())
import pandas as pd
# 导入pandas库,用于读取数据df = pd.read_csv("heart.csv")
# read_csv函数,可以读取csv文件,括号内的csv文件是在当前.py文件同一目录下print(df.head())
# df.head() 输出前5行的数据
# df.tail() 输出最后5行的数据

下面是输出结果:
在这里插入图片描述

2.2 简单分析属性的相关系数关系

corr()方法:返回数据类型的相关系数矩阵(每两个类型之间的相关性)

# data是一个DataFrame类型的数据
data.corr() #相关系数矩阵,即给出了任意两个变量之间的相关系数
data.corr()[u’好’] #只显示“好”与其他感情色彩的相关系数
data[u’好’].corr(data[u’哭’]) #两个感情色彩的相关系数

http://chatgpt.dhexx.cn/article/nMjjRlk2.shtml

相关文章

UCI数据集中文介绍:Waveform Database Generator (Version 1) Data Set

看论文用到了该数据集,没找到中文描述,且官网上描述非常简洁。所以查阅了原版书,将该数据集的介绍整理如下。 实验数据集:波形数据集(下载网址:UCI Machine Learning Repository: Waveform Database Generator (Versi…

机器学习——Azure机器学习模型在线搭建实验原理+详细操作步骤+分析(以UCI数据库的数据为例)

Azure机器学习模型搭建实验 本文数据及文档地址:https://github.com/w1449550206/Azure-machine-learning-model-building-experiment.git 文章目录 Azure机器学习模型搭建实验机器学习工作流程总结登录方法Azure平台简介Azure机器学习实验详细操作步骤 Azure机器…

卜若的代码笔记-机器学习基础-UCI数据库简介与Iris数据集分析

1.机器学习和深度学习有些许差别 深度学习属于机器学习的子类,更加瞄准于CNN,RNN等网络,本课程主要针对于机器学习的扫盲 1.1 UCI官网 如果你是一个正在研究机器学习的菜鸟,或者感兴趣的guys,那么,你一定…

UCI数据库

UCI数据库是加州大学欧文分校(University of CaliforniaIrvine)提出的用于机器学习的数据库,这个数据库目前共有335个数据集,其数目还在不断增加,UCI数据集是一个常用的标准测试数据集。 UCI数据可以使用Matlab的dlmread(或textr…

UCI数据集详解及其数据处理(附148个数据集及处理代码)

摘要:本文对机器学习中的UCI数据集进行介绍,带你从UCI数据集官网出发一步步深入认识数据集,并就下载的原始数据详细讲解了不同类型的数据集整理如何通过程序进行整理。为了方便使用,博文中附上了包括数据集整理及数据预处理在内的…

【20211208】【Python】UCI数据集的简单介绍和使用Python保存UCI数据集为.mat文件

一、UCI 数据集介绍 进行机器学习学习过程中,会使用到 UCI 公开数据集,UCI 数据集网址:UCI Machine Learning Repository。 点击进入之后,页面显示如下: 以 iris 数据集为例,点击进入: 该页面展…

UCI数据集整理(附论文常用数据集)

摘要:UCI数据集作为标准测试数据集经常出现在许多机器学习的论文中,为了更方便使用这些数据集有必要对其进行整理,这里整理了论文中经常出现的数据集,并详细介绍如何使用MATLAB将数据集文件整理成自己需要的格式以及如何使用数据集…

【Android系统源码修改】修改系统默认定位方式

gps 移动网络位置信息 gps 修改为 gps,network 或者 network 或者 是否支持gps \frameworks\base\services\core\java\com\android\server\location\GpsLocationProvider.java ro.wisky.gpssupport 此值设为 false 时不支持,则系统中一些有关 gps 的设置将会被屏蔽…

android 修改 dpi_设计规范 | Android系统

一、基础概念 1.1 屏幕尺寸 屏幕尺寸指的是手机屏幕的物理尺寸,一般用屏幕对角线长度表示,以英寸(inch)为单位。如,小米M4尺寸为5英寸。 1.2 屏幕密度 由于Android属于开源系统,任何用户、开发者、运营商都可以对Android进行专属定制,因此导致国内安卓手机尺寸众多,然而设…

android注入 定位,[原创]修改源码实现全局(无需root)注入躲开注入检测

看这篇文章需要的技能 1.会编译android源码(如果你不愿意编译源码,还有另外一种办法,下面我会提供) 2.会使用substrate或者xposed 以上2个网上资料很多我就不啰嗦了 一、市面上目前的hook和注入工具 市面上目前的hook有substrate,xposed,或者一些开源的自己实现的hook和注入…

python修改app定位_APP自动化中三大定位工具

我们在做APP自动化的时候,定位是很重要的,就像做webUI自动化一样,但是个人觉得app定位比web要复杂点,毕竟app定位表达式写了之后并没有工具验证改表达式是唯一的,所以导致工作量很大 今天主要总结下我们做app自动化需要…

android位置模拟源码,android 模拟定位app 源码

【实例简介】需要在android手机的 开发者模式中 开启 【允许模拟位置】即可,开启允许模拟位置的方法详见: https://jingyan.baidu.com/article/870c6fc306f1f4b03ee4be7f.html 【实例截图】 【核心代码】 package com.xd.mockposition; import android.app.Activity; import …

android 修改imei源码,Android 修改imei、gps等信息分析

之前有朋友希望能修改Android的gps信息,也就是说让其他应用获取gps信息时,取到修改后的信息。一开始听上去感觉挺不靠谱的,后来网上查了下资料,发现还是有人搞定的,主要都是通过古河发布的注入代码,将自己的…

怎么修改android内存,安卓内存修改器怎么用?

安卓内存修改器怎么用?内存搜索是手游修改器普遍都具有的一项功能,也是目前最主流的游戏修改方式,安全、快速、效果显著,并且不会轻易被官方封号,GG助手除了拥有大内高手不断升级制作的插件外,也集成了一个标配的内存修改器。下面学习啦小编给大家分享下具体的方法,希望…

Android模拟地图gps定位

目录 1.判断权限2.开始定位(GPS位置)3.关闭位置4.实现效果 公司OA经常忘了打卡,想起来就到家了,这就很烦… 参考Android官方文档,学习使addTestProvider,setTestProviderLocation,实现简单指定经纬度GPS位置,要是忘了打卡,可不能用这个… 运行环境 设备:小米K30s 系统:Android1…

怎样修改安卓位置服务器,修改安卓定位服务器地址

修改安卓定位服务器地址 内容精选 换一换 安卓模拟器(Android Virtual Device),简称AVD,可以模拟安卓设备并将其运行在服务器上。利用AVD,您可以对安卓应用进行原型设计、开发和测试,而无需使用真实的手机。AVD具备运行安卓应用、adb连接、上网、屏幕、GPS定位、电池、及VN…

安卓修改gps定位模拟百度地图移动

背景: 开发一个骑行app,页面是百度导航,演示需要模拟人骑行,位置不断移动。 位置模拟 核心是这个: for (String provider : mockProviders) {Location mockLocation null;if (location null) {mockLocation new…

第二十期 在Android中修改GPS定位数据的完整方案《手机就是开发板》

https://blog.csdn.net/aggresss/article/details/54323034 现在很多的应用都是基于位置服务的,而且把位置服务作为重要的参考标准,其实这是很不安全的,位置信息的数据未经过任何加密,而且是从我们的手机中发送出去的,…

Android-Framework-GPS定位原理和修改

一、 Android定位功能原理概述 1.1 Android三种定位提供方式。 Android 应用层获取定位可以通过三种定位提供方式:gps,network,passive。 gps –>(GPS,AGPS): GPS位置提供者的名称。该提供商…

HDFS命令

用法 1.hadoop xxx hadoop fs命令可用于其他文件系统,不止是hdfs文件系统内也就是说该命令的使用范围更广,可以用于HDFS、Local FS等不同的文件系统 2.hdfs xxx hdfs dfs命令只用于hdfs文件系统 命令 1.用户命令 fsck:磁盘检查dfs&…