UCF101数据集处理

article/2025/3/19 22:29:40

UCF101数据集处理


在复现动作识别类的算法时,常需要用到数据集。ucf101就是其中一个。

之前复现代码时所用的ucf101数据集是直接将原数据集中的视频处理成图片。数据集目录如下:
UCF101/ApplyEyeMakeup/v_ApplyEyeMakeup_g01_c01/img_00001.jpg
(此时通过train.txt和test.txt两个文本文档来读取数据集信息。两个文本中有三列内容,第一列是路径,第二列是视频的帧数,第三列是视频的类别)
train.txt内容

这次代码复现则需要将整个数据集分成两个部分 训练集 和测试集。那么数据集目录需要转换成以下形式:
UCF101/train/ApplyEyeMakeup/v_ApplyEyeMakeup_g01_c01/img_00001.jpg
UCF101/test/ApplyEyeMakeup/v_ApplyEyeMakeup_g01_c02/img_00001.jpg

因为手动复制文件夹过于麻烦,所以采用python编程来完成。主要思想就是通过读取上面所说的train.txt和test.txt文件,然后将对应的文件夹放入train、test文件夹下面。代码如下:

#coding:utf-8
import os,shutil
#移动文件夹的函数,将一个文件夹下所有文件移动到另一个文件夹下
def move_file(orgin_path,moved_path):  dir_files=os.listdir(orgin_path)   #得到该文件夹下所有文件for file in dir_files:file_path = os.path.join(orgin_path,file) #路径拼接成绝对路径if os.path.isfile(file_path):  #如果是文件,则打印这个文件路径if file.endswith(".jpg"):if os.path.exists(os.path.join(moved_path,file)):print("有重复文件,跳过,不移动")continueelse:shutil.move(file_path, moved_path)if os.path.isdir(file_path): #如果是目录,就递归子目录moved_path=os.path.join(moved_path,file)if not os.path.exists(moved_path):os.mkdir(moved_path)move_file(file_path,moved_path)print("移动文件成功!")list_file='yourpath/ucf101test02.txt' #存有train/test.txt文件的路径
root='yourpath/UCF101/origin' #原数据集的目录
destinate='yourpath/UCF101/test'  #目标位置的目录
tmp = [x.strip().split(',') for x in open(list_file)] #将.txt文档中的内容以逗号分隔class_ = sorted(os.listdir(root))for c in class_:class_path = os.path.join(destinate, c) #在目标位置下建好分类级的文件夹,如/mnt/data/public/UCF101/testApplyEyemakeup,#因为不可以越过一个不存在的目录,新建更深层的目录if not os.path.exists(class_path):os.mkdir(class_path)for i in range(0,len(tmp)):root_path=os.path.join(root,tmp[i][0])   #原路径dest_path=os.path.join(destinate,tmp[i][0])  #目标路径if not os.path.exists(dest_path):  #若不存在目标路径则新建os.mkdir(dest_path)  move_file(root_path,dest_path)  #将原路径下的文件移动到目标目录下

通过该程序就可以将原有的整个UCF101数据集分成 训练集 和测试集 了


http://chatgpt.dhexx.cn/article/ZTNadQkW.shtml

相关文章

深度学习视频数据集(动作识别):UCF-101

UCF-101 官网:https://www.crcv.ucf.edu/research/data-sets/ucf101/ 网盘:链接:https://pan.baidu.com/s/1RsJuykWyUlQ4_c1TwqxR_Q 提取码:909g 官方解释 UCF101是一个现实动作视频的动作识别数据集,收集自YouTub…

UCF101数据集提取帧+TDN部署(Anaconda+Python3.7+Pytorch)

UCF101数据集提取帧TDN部署(AnacondaPython3.7Pytorch) 前言一、安装MMAction21.引入库2.环境搭建3.安装4.准备原始数据集5.制作视频提取帧数据集 二、部署TDN1.引入库2.读入数据3.训练模型4.查看结果 本人实测结果 前言 将TDN部署在个人电脑上&#xf…

UCF101动作识别数据集简介绍及数据预处理

文章目录 一、数据集简介:二、数据集获取及解压缩:1. 数据下载2. 数据集解压缩: 三、数据集划分四、数据集预处理1. 生成pkl文件2. 直接对视频文件处理 一、数据集简介: UCF101是一个现实动作视频的动作识别数据集,收…

【Java】内部类的定义

目录 一、前言 二、内部类 语法格式: static修饰内部类 内部类未被static修饰时: 内部类被static修饰后 演示操作: 一、前言 前面我们学习了一个小的项目,现在我们来学习新的知识点,关于内部类的描述&#xff0…

Java类的定义、声明及使用

1、 class 类名称{属性方法} 2、声明一个类需要通过一个关键字class 3、类与对象的关系 1)类是对某一类事物的描述,是抽象的、概念上的意义,对象是实际存在的该类事物的每一个个体,也被称为实例。 package classdemo; class …

C#类的定义

在C#语言中创建的任何项目都有类的存在,通过类能很好地体现面向对象语言中封装、继承、多态的特性。 类的访问修饰符:用于设定对类的访问限制,包括 public、internal 或者不写,用 internal 或者不写时代表只能在当前项目中访问类…

C#类的定义和声明及使用

类的定义 类的成员 } 例如,以水果为例来声明一个类,代码如下:在 C# 语言中创建的任何项目都有类的存在,通过类能很好地体现面向对象语言中封装、继承、多态的特性。 简单的来说,在C#编程里,类是一种数据结…

(27)python类的定义和使用

面向对象初步 面向对象(Object oriented Programming,OOP)编程的思想主要是针对大型软件设计而来的。面向对象编程使程序的扩展性更强、可读性更好,使的编程可以像搭积木一样简单。 面向对象编程将数据和操作数据相关的方法封装…

类的认识和定义

前言 C为啥要引入类这个概念呢,以C实现栈为例说明。 typedef int STDataType; typedef struct Stack { . . . .int top; . . . .STDataType* data; . . . .int capacity; }Stack; void StackInit(Stack* ps); //栈的初始化 void StackDestory(Stack* ps); //栈的销…

Python类的定义

类的定义:我们把对象比作一个“饼干”,类就是制造这个饼干的模具。通过类定义数据类型的属性和方法,也就是说,“类将行为和状态打包在一起”。 类的结构 方法(函数)..............行为 属性(…

java类的定义

目录 一、概念二、使用1.成员变量2.成员方法3.权限修饰符4.静态方法 三、重写toString方法 一、概念 我们不能将一个事物称之为一类事物,例如一只鸟我们不能称为鸟类,但是我们需要给一类事物统称,例如大雁,麻雀,燕子&…

C++ 类的定义与使用

十二、类与对象 对象:就是我们生活中的具体事物,看得见摸得到,有一定的属性和行为或操作方式 面向对象:是一种软件的开发方法,对象所指的是计算机系统中的某一个成分。在面向对象程序设计中,对象包含两个…

4.类的定义,变量类型,方法类型

文章目录 1.类的概念1.1 如何创建一个类1.2 如何定义一个类1.2.1变量1.2.2 方法 2.对象3.类定义使用实例4.理解类和对象的关系4.1.一个java程序和类之间的关系 5.细节知识分析5.1.类与类的关系5.2.变量和变量区别5.3.方法的区别5.4.类方法和类变量的特点 1.类的概念 类java是基…

关于类的定义

类的定义 类的概念如何定义类修饰符 类的概念 1、类是把事物的数据与相关功能封装到一起,形成一种特殊的数据结构,用以表达真是事物的一种抽象;而对象则是实际存在的属该类事物的具体个体,因而也称为实例(instance&am…

python 爬虫爬取疫情数据,爬虫思路和技术你全都有哈(一)

python 爬虫爬取疫情数据,爬虫思路和技术你全都有哈(二、数据清洗及存储) 爬起疫情数据,有两个网址: 1、百度:链接 2、丁香园疫情:链接 在这两个中,丁香园的爬虫相对简单一点&#…

采用python爬虫爬取数据然后采用echarts数据可视化分析

前言:采用python爬虫爬取天气数据然后采用echarts数据可视化画图分析未来天气变化趋势 从获取数据到可视化的流程 (熟悉爬虫爬取数据然后数据可视化这个过程) 一、python爬取未来8-15天的天气数据 1、导入用到的一些python第三方库 imp…

python网络爬虫爬取数据,python全网爬取内容

大家好,小编来为大家解答以下问题,python网络爬虫爬取数据,利用python爬取数据,现在让我们一起来看看吧! 网络爬虫,就是按照一定规则自动访问互联网上的信息并把内容下载下来的程序或脚本。 在整个的Python…

Python爬虫爬取网页数据并存储(一)

Python爬虫爬取网页数据并存储(一) 环境搭建爬虫基本原理urllib库使用requests库使用正则表达式一个示例 环境搭建 1.需要事先安装anaconda(或Python3.7)和pycharm *anaconda可在中科大镜像下下载较快 2.安装中遇到的问题&#x…

【用Java爬取网页图片——爬虫爬取数据】

用Java爬取网页图片——爬虫爬取数据 1、在创建项目中导入jsoup 2、创建一个保存下载图片的路径 3、使用URL读取网页路径,jsoup读取网页内容 4、利用属性标签获取图片连接块 5、因为该路径没有http:头,用StringBuilder增加 5、完善下载路径…

爬虫爬取数据

打开爬取工具页面,使用爬虫工具列表: 开始节点 仅仅是爬虫的起点,所有流程图必须有该节点。 爬取节点 该节点用于请求HTTP/HTTPS页面或接口 请求方法:GET、POST、PUT、DELETE等方法 URL: 请求地址 延迟时间:单位是毫秒,意思是爬取之前延迟一段时间在执行抓取 超时时间:网…