【20211208】【Python】UCI数据集的简单介绍和使用Python保存UCI数据集为.mat文件

article/2025/10/12 1:04:53

一、UCI 数据集介绍

        进行机器学习学习过程中,会使用到 UCI 公开数据集,UCI 数据集网址:UCI Machine Learning Repository。

        点击进入之后,页面显示如下:

        以 iris 数据集为例,点击进入:

        该页面展示了该数据集的相关信息,包括:数据及相关介绍、相关任务、样本个数、特征个数、是否有缺失值等。

        常见数据集及其样本个数、特征个数总结:

        更为详细的数据集介绍和使用方法见下面参考链接,因为本文是利用 Python 读取数据集,所以就不在此赘述了~ 

        (参考:UCI数据集整理(附论文常用数据集))

        (参考:UCI数据集详解及其数据处理(附148个数据集及处理代码))

二、使用 Python 读取 UCI 数据集,并保存成 .mat 数据

        在 UCI 网站下载数据集固然可行,但突然想到 Python 中的 sklearn.datasets 可以直接 load 数据集,所以直接借用 Python 了。

        代码如下: 

import numpy as np
from sklearn import datasets  # UCI 数据集在sklearn.datasets中有
from scipy import io as scio  # 用来save .mat数据# 载入wine数据集
Data = datasets.load_wine()feaName = Data.feature_names  # 数据集特征名称
tarName = Data.target_names  # 数据集标签名称myData = np.array(Data.data)  # 数据集数据
labels = np.array(Data.target)  # 数据集标签DataSet = {}
DataSet['feature_names'] = feaName
DataSet['class_names'] = tarName
DataSet['data'] = myData
DataSet['label'] = labels# 保存数据到 .mat 文件中
scio.savemat('DataSet_UCIwine.mat', DataSet)

        (参考:python读取文件——python读取和保存mat文件 ) 

三、sklearn.datasets.load_wine() 使用方法 

        本节详细介绍 sklearn.datasets.load_wine() 的返回值,即 Data 是什么?

from sklearn import datasetsData = datasets.load_wine()

         可以看出,Data 是一个 Bunch 模式的数据,其中包含 data(数据集数据)、feature_names(特征名字)、target(数据集标签)、target_names(分类后的类别名字)等信息,所以可以通过 Data.data, Data.target 等的方法获取数据和相应标签等。

        (参考:【20210924】【机器/深度学习】以鸢尾花卉数据集为例,使用K折交叉验证选取KNN算法最优的模型参数实例)

四、知识点

1. Bunch 模式

        Bunch 模式继承自 Dict 类,所以它具有 Dict 类的所有属性。

        Bunch 模式非常灵活,其属性可以动态设置,可以使用它实现多种类型,尤其适用于建立树形结构。

        (参考:Python中的Bunch模式)

        (参考:python函数——Bunch配置加载)

        (参考:Python中的Bunch模式)


http://chatgpt.dhexx.cn/article/JBZHBRXV.shtml

相关文章

UCI数据集整理(附论文常用数据集)

摘要:UCI数据集作为标准测试数据集经常出现在许多机器学习的论文中,为了更方便使用这些数据集有必要对其进行整理,这里整理了论文中经常出现的数据集,并详细介绍如何使用MATLAB将数据集文件整理成自己需要的格式以及如何使用数据集…

【Android系统源码修改】修改系统默认定位方式

gps 移动网络位置信息 gps 修改为 gps,network 或者 network 或者 是否支持gps \frameworks\base\services\core\java\com\android\server\location\GpsLocationProvider.java ro.wisky.gpssupport 此值设为 false 时不支持,则系统中一些有关 gps 的设置将会被屏蔽…

android 修改 dpi_设计规范 | Android系统

一、基础概念 1.1 屏幕尺寸 屏幕尺寸指的是手机屏幕的物理尺寸,一般用屏幕对角线长度表示,以英寸(inch)为单位。如,小米M4尺寸为5英寸。 1.2 屏幕密度 由于Android属于开源系统,任何用户、开发者、运营商都可以对Android进行专属定制,因此导致国内安卓手机尺寸众多,然而设…

android注入 定位,[原创]修改源码实现全局(无需root)注入躲开注入检测

看这篇文章需要的技能 1.会编译android源码(如果你不愿意编译源码,还有另外一种办法,下面我会提供) 2.会使用substrate或者xposed 以上2个网上资料很多我就不啰嗦了 一、市面上目前的hook和注入工具 市面上目前的hook有substrate,xposed,或者一些开源的自己实现的hook和注入…

python修改app定位_APP自动化中三大定位工具

我们在做APP自动化的时候,定位是很重要的,就像做webUI自动化一样,但是个人觉得app定位比web要复杂点,毕竟app定位表达式写了之后并没有工具验证改表达式是唯一的,所以导致工作量很大 今天主要总结下我们做app自动化需要…

android位置模拟源码,android 模拟定位app 源码

【实例简介】需要在android手机的 开发者模式中 开启 【允许模拟位置】即可,开启允许模拟位置的方法详见: https://jingyan.baidu.com/article/870c6fc306f1f4b03ee4be7f.html 【实例截图】 【核心代码】 package com.xd.mockposition; import android.app.Activity; import …

android 修改imei源码,Android 修改imei、gps等信息分析

之前有朋友希望能修改Android的gps信息,也就是说让其他应用获取gps信息时,取到修改后的信息。一开始听上去感觉挺不靠谱的,后来网上查了下资料,发现还是有人搞定的,主要都是通过古河发布的注入代码,将自己的…

怎么修改android内存,安卓内存修改器怎么用?

安卓内存修改器怎么用?内存搜索是手游修改器普遍都具有的一项功能,也是目前最主流的游戏修改方式,安全、快速、效果显著,并且不会轻易被官方封号,GG助手除了拥有大内高手不断升级制作的插件外,也集成了一个标配的内存修改器。下面学习啦小编给大家分享下具体的方法,希望…

Android模拟地图gps定位

目录 1.判断权限2.开始定位(GPS位置)3.关闭位置4.实现效果 公司OA经常忘了打卡,想起来就到家了,这就很烦… 参考Android官方文档,学习使addTestProvider,setTestProviderLocation,实现简单指定经纬度GPS位置,要是忘了打卡,可不能用这个… 运行环境 设备:小米K30s 系统:Android1…

怎样修改安卓位置服务器,修改安卓定位服务器地址

修改安卓定位服务器地址 内容精选 换一换 安卓模拟器(Android Virtual Device),简称AVD,可以模拟安卓设备并将其运行在服务器上。利用AVD,您可以对安卓应用进行原型设计、开发和测试,而无需使用真实的手机。AVD具备运行安卓应用、adb连接、上网、屏幕、GPS定位、电池、及VN…

安卓修改gps定位模拟百度地图移动

背景: 开发一个骑行app,页面是百度导航,演示需要模拟人骑行,位置不断移动。 位置模拟 核心是这个: for (String provider : mockProviders) {Location mockLocation null;if (location null) {mockLocation new…

第二十期 在Android中修改GPS定位数据的完整方案《手机就是开发板》

https://blog.csdn.net/aggresss/article/details/54323034 现在很多的应用都是基于位置服务的,而且把位置服务作为重要的参考标准,其实这是很不安全的,位置信息的数据未经过任何加密,而且是从我们的手机中发送出去的,…

Android-Framework-GPS定位原理和修改

一、 Android定位功能原理概述 1.1 Android三种定位提供方式。 Android 应用层获取定位可以通过三种定位提供方式:gps,network,passive。 gps –>(GPS,AGPS): GPS位置提供者的名称。该提供商…

HDFS命令

用法 1.hadoop xxx hadoop fs命令可用于其他文件系统,不止是hdfs文件系统内也就是说该命令的使用范围更广,可以用于HDFS、Local FS等不同的文件系统 2.hdfs xxx hdfs dfs命令只用于hdfs文件系统 命令 1.用户命令 fsck:磁盘检查dfs&…

hadoop之hdfs命令

目录 1:创建目录 2、查看文件,ls 没有cd命令, 需要指定绝对路径 3:上传文件 put(要先把数据上传到linux本地然后再上传) 4:下载文件 get 5:复制 cp 6:查看文件内容 cat , 如果数…

hadoop(五)-hdfs命令行基本命令

HDFS是存取数据的分布式文件系统,那么对HDFS的操作,就是文件系统的基本操作,比如文件的创建、修改、删除、修改权限等,文件夹的创建、删除、重命名等。对HDFS的操作命令类似于Linux的shell对文件的操作,如ls、mkdir、r…

hadoop中上输入hdfs 相关命令显示无法找到问题

问题可能是没有在主目录配置你自己hadoop相关环境变量 解决方法: 1:切换到主目录,输入命令cd ~ 2:输入如下命令进入编辑: 3:在编辑页面最底部,输入如下命令: 4:退出保存编辑输入命令…

HDFS的命令操作

1)基本语法 bin/hdfs dfs 具体命令 2) 常用命令实操 (1)-help:输出这个命令参数 bin/hdfs dfs -help rm (2)-ls: 显示目录信息 hdfs dfs -ls / (3)-mkdir:在hdfs上创…

【hadoop系列】Hadoop HDFS命令

格式:hadoop fs -命令 主要有如下的命令: 命令说明hadoop fs -mkdir创建HDFS目录hadoop fs -ls列出HDFS目录hadoop fs -copyFromLocal使用-copyFromLocal复制本地文件(local)到HDFShadoop fs -put使用-put复制本地(lo…

【hadoop系列】Hadoop HDFS命令

格式:hadoop fs -命令 主要有如下的命令: 命令 说明 hadoop fs -mkdir 创建HDFS目录 hadoop fs -ls 列出HDFS目录 hadoop fs -copyFromLocal 使用-copyFromLocal复制本地文件(local)到HDFS hadoop fs -put 使用-put复制…