flyai中的dataset对象

article/2025/9/19 10:32:21
Help on Dataset in module flyai.dataset object:class Dataset(builtins.object)
|  Methods defined here:
|
|  __init__(self, epochs=5, batch=32, val_batch=32)
|      :param epochs: 训练的轮次,最大不超过100
|      :param batch: 训练的批次大小,太大会导致显存不足
|      :param val_batch: 验证的批次大小
|
|  add_aug_data(self, data)
|      把自自己增强的数据,加入到训练的csv中,使用dataset.next_train_batch()可读取到增强后的数据
|      :param data: data的数据格式为:
|                  单条数据
|                  {
|                  "image_path": ["images/skunk/cifar100_48287_75.png"],
|
|                  "label":[75]
|                  }
|                  多条数据
|                  {
|                  "image_path": ["images/skunk/cifar100_48287_75.png","images/bicycle/cifar100_38531_8.png"],
|
|                  "label": [75,8]
|                  }
|
|  create_instance(self, module_name, class_name, *args, **kwargs)
|
|  evaluate_data(self, path=None)
|
|  evaluate_data_no_processor(self, path=None)
|      获取所有原始验证集数据
|      :return:x_val,y_val
|
|  evaluate_source(self, path)
|
|  get_all_data(self)
|      获取所有原始数据
|      :return:x_train,y_train,x_val,y_val
|
|  get_all_processor_data(self)
|      获取所有在processor.py中,通过input_x方法处理过的数据
|      :return:x_train,y_train,x_val,y_val
|
|  get_all_validation_data(self)
|      获取所有在processor.py中,通过input_x方法处理过的验证集数据
|      :return:x_val,y_val
|
|  get_method_dict(self, clz, method_name, **args)
|
|  get_method_list(self, clz, method_name, *args)
|
|  get_step(self)
|      根据dataset传入的epochs和batch,计算出来的训练总次数。
|      :return: 返回训练总次数
|
|  get_train_length(self)
|      获取训练集总数量,本地调用返回的是100条,在GPU上调用返回全部数据集数量。
|      :return: 返回训练集总数量
|
|  get_validation_length(self)
|      获取验证集总数量,本地调用返回的是100条,在GPU上调用返回全部数据集数量。
|      :return: 返回验证集总数量
|
|  image_aug(self, target_size, epochs=1, seed=None, featurewise_center=False, samplewise_center=False, featurewise_std_normalization=False, samplewise_std_normalization=False, zca_whitening=False, zca_epsilon=1e-06, rotation_range=0, width_shift_range=0.0, height_shift_range=0.0, brightness_range=None, shear_range=0.0, zoom_range=0.0, channel_shift_range=0.0, fill_mode='nearest', cval=0.0, horizontal_flip=False, vertical_flip=False, rescale=None, preprocessing_function=None, aug_label=False)
|      为图片做增强的数据,加入到训练的csv中,使用dataset.next_train_batch()可读取到增强后的数据
|      :param target_size: 增强图片的大小 如(256,256)
|      :param epochs: 对图片增强几轮,每轮一张图片。
|      :param batch_size: 每次增强多少张图片。
|      :param seed: 进行随机图像变换, 通过设置seed可以达到同步变换。
|      :param featurewise_center: 布尔值,对输入的图片每个通道减去每个通道对应均值。
|      :param samplewise_center: 布尔值,每张图片减去样本均值, 使得每个样本均值为0|      :param featurewise_std_normalization: 布尔值,将输入除以数据集的标准差以完成标准化
|      :param samplewise_std_normalization: 布尔值,将输入的每个样本除以其自身的标准差
|      :param zca_whitening: 布尔值,对输入数据施加ZCA白化
|      :param zca_epsilon:ZCA白化值。默认值为1e-6|      :param rotation_range: 整数,数据提升时图片随机转动的角度
|      :param width_shift_range: 浮点数,图片宽度的某个比例,数据提升时图片水平偏移的幅度
|      :param height_shift_range: 浮点数,图片高度的某个比例,数据提升时图片竖直偏移的幅度
|      :param brightness_range: Tuple 或者 list对数据进行亮度处理
|      :param shear_range: 浮点数,剪切强度(逆时针方向的剪切变换角度)
|      :param zoom_range: 浮点数或形如[lower,upper]的列表,随机缩放的幅度,若为浮点数,则相当于[lower,upper] = [1 - zoom_range, 1 zoom_range]
|      :param channel_shift_range: 浮点数,随机通道偏移的幅度
|      :param fill_mode: constant,nearest,reflect或wrap之一,当进行变换时超出边界的点将根据本参数给定的方法进行处理
|      :param cval: 浮点数或整数,当fill_mode=constant时,指定要向超出边界的点填充的值
|      :param horizontal_flip: 布尔值,进行随机水平翻转
|      :param vertical_flip: 布尔值,进行随机竖直翻转
|      :param rescale: 重放缩因子,默认为None. 如果为None0则不进行放缩,否则会将该数值乘到数据上(在应用其他变换之前)
|      :param preprocessing_function: 增强后自定义处理函数
|      :param aug_label: 是否对label标签增强,一般应用在图像分割等领域。
|      :return:
|
|  next_batch(self, size=32, test_size=32, test_data=True)
|      获取一批训练和验证数据,可以自己设置返回的大小。
|      :return:x_train,y_train,x_val,y_val
|
|  next_train_batch(self)
|      获取一批训练数据,返回数据的数量是dataset中batch的大小。
|      :return: x_train,y_train
|
|  next_validation_batch(self)
|      获取一批验证数据,返回数据的数量是dataset中val_batch的大小。
|      :return: x_val,y_val
|
|  output_y(self, predict)
|
|  predict_data(self, **data)
|
|  processor_x(self, x_datas)
|
|  processor_y(self, y_datas)
|
|  to_categorys(self, predict)
|
|  ----------------------------------------------------------------------
|  Data descriptors defined here:
|
|  __dict__
|      dictionary for instance variables (if defined)
|
|  __weakref__
|      list of weak references to the object (if defined)None

get_all_data()返回的是字典,图像的地址和label。
在这里插入图片描述
next_batch()返回的是数据
在这里插入图片描述


http://chatgpt.dhexx.cn/article/0iVKHAOt.shtml

相关文章

FlyAI资讯:Uber正式开源分布式机器学习平台:Fiber

摘要:在过去的几年中,计算机不断增强的处理能力推动了机器学习的进步。算法越来越多地利用并行性,并依赖分布式训练来处理大量数据。然而,随之而来的是增加数据和训练的需求,这对管理和利用大规模计算资源的软件提出了…

FlyAI小课堂:Python机器学习笔记:Logistic Regression

Logistic回归公式推导和代码实现 1,引言 logistic回归是机器学习中最常用最经典的分类方法之一,有人称之为逻辑回归或者逻辑斯蒂回归。虽然他称为回归模型,但是却处理的是分类问题,这主要是因为它的本质是一个线性模型加上一个映…

FlyAI竞赛:图片颜值打分趣味赛

人工智能学习离不开实践的验证,推荐大家可以多在FlyAI-AI竞赛服务平台多参加训练和竞赛,以此来提升自己的能力。FlyAI是为AI开发者提供数据竞赛并支持GPU离线训练的一站式服务平台。每周免费提供项目开源算法样例,支持算法能力变现以及快速的…

FlyAI小课堂:Tensorflow-分布式训练

人工智能学习离不开实践的验证,推荐大家可以多在FlyAI-AI竞赛服务平台多参加训练和竞赛,以此来提升自己的能力。FlyAI是为AI开发者提供数据竞赛并支持GPU离线训练的一站式服务平台。每周免费提供项目开源算法样例,支持算法能力变现以及快速的…

FlyAI小课堂:【文本分类-中文】textRNN

摘要: 随着深度学习的快速发展,人们创建了一整套神经网络结构来解决各种各样的任务和问题。在英文分类基础上,中文文本分类的处理也同样重要... 人工智能学习离不开实践的验证,推荐大家可以多在FlyAI-AI竞赛服务平台多参加训练和竞赛&#x…

FlyAI小课堂:【文本分类-中文】textCNN

摘要: 随着深度学习的快速发展,人们创建了一整套神经网络结构来解决各种各样的任务和问题。在英文分类基础上,中文文本分类的处理也同样重要... 人工智能学习离不开实践的验证,推荐大家可以多在FlyAI-AI竞赛服务平台多参加训练和竞赛&#x…

FlyAI人工智能社区参赛指南—用户体验版

Fly-AI竞赛服务平台 flyai.com 在开始学习之前推荐大家可以多在 FlyAI竞赛服务平台多参加训练和竞赛,以此来提升自己的能力。FlyAI是为AI开发者提供数据竞赛并支持GPU离线训练的一站式服务平台。每周免费提供项目开源算法样例,支持算法能力变现以…

FlyAI资讯:GPT-3的威力,助力AI领域

摘要:大概一个月之前,史上最巨无霸NLP模型GPT-3问世。当时它向世界展示的能力是,“不仅会写短文,而且写出来的作文挺逼真的,几乎可以骗过人类,可以说几乎通过了图灵测试。”可能是因为它的前一代模型GPT-2也…

FlyAI赛题预告:时间序列初学者指南

近期,FlyAI服务竞赛平台将上线时间序列相关赛题,看到此文的童鞋们可以多多关注下;推荐大家可以多在FlyAI竞赛服务平台多参加训练和竞赛,以此来提升自己的能力。FlyAI是为AI开发者提供数据竞赛并支持GPU离线训练的一站式服务平台。…

FlyAI资讯:人工智能的前世今生

摘要: 现代电子产品和设备在诸如通信 、娱乐 、安全和医疗保健等许多方面改善了我们的生活质量 ,这主要是因为现代微电子技术的发展极大地改变了人们的日常工作和互动方式。在过去几十年中,摩尔定律一直是通过不断缩小芯 … 人工智能学习离不开实践的验…

FlyAI小课堂:Tensorflow基操

人工智能学习离不开实践的验证,推荐大家可以多在FlyAI-AI竞赛服务平台多参加训练和竞赛,以此来提升自己的能力。FlyAI是为AI开发者提供数据竞赛并支持GPU离线训练的一站式服务平台。每周免费提供项目开源算法样例,支持算法能力变现以及快速的…

FlyAI资讯:台积电布局新存储技术

摘要:近年来,在人工智能(AI)、5G等推动下,以MRAM(磁阻式随机存取存储器)、铁电随机存取存储器 (FRAM)、相变随机存取存储器(PRAM),以及可变电阻式随机存取存储…

强烈推荐!FlyAI机器学习数据竞赛启动,丰厚奖金等你来拿

FlyAI 数据竞赛平台 FlyAI 是隶属于北京智能工场科技有限公司旗下,为AI开发者 (深度学习)提供数据竞赛并支持GPU离线训练的一站式服务平台。每周免费提供项目开源算法样例,样例所使用开发框架涉及TensorFlow、Keras、PyTorch. 支持…

FlyAI竞赛服务平台赛题上新——手写英文字体识别(名企内推)

人工智能学习离不开实践的验证,推荐大家可以多在FlyAI-AI竞赛服务平台多参加训练和竞赛,以此来提升自己的能力。FlyAI是为AI开发者提供数据竞赛并支持GPU离线训练的一站式服务平台。每周免费提供项目开源算法样例,支持算法能力变现以及快速的…

万元大奖,FlyAI算法新赛事,心理卡牌目标检测

本文转自竞赛社区FlyAI最新上线算法赛。 “心理卡牌目标检测算法赛”由测测星座与趣鸭心理联合发起的线上竞赛项目。2020年新冠肺炎疫情打破了我们平静的生活,影响了我们的身体健康和精神健康。在国家发布的《“健康中国2030”规划纲要》中也提到,要加大…

百万现金奖励,FlyAI实时竞赛等你来战

点击我爱计算机视觉标星,更快获取CVML新技术 这是一种新的算法竞赛方式! FlyAI是一个为算法工程师提供(深度学习)项目竞赛并支持GPU离线训练的网站。目前每周更新两个以上现金奖励的竞赛项目。项目涉及领域包括图像识别/分类/检测…

使用FlyAI进行科学数据竞赛

转自百度经验 https://jingyan.baidu.com/article/acf728fd9c3e6af8e510a392.html 工具/原料 python3 Windows命令行(mac/Linux都可运行,此经验以Windows为例) 百度经验:jingyan.baidu.com 注册账号 1 使用浏览器打开 www.flyai.com,并点击注…

FlyAI资讯:收藏!深度学习必读10篇经典算法论文总结!

前言 目录 前言 1998年:LeNet 2012年:AlexNet 2014年:VGG 2014年:GoogLeNet 2015年:Batch Normalization 2015年:ResNet 2016年:Xception 2017年:MobileNet 2017年&#…

FlyAi实战之MNIST手写数字识别练习赛(准确率99.55%)

欢迎关注WX公众号:【程序员管小亮】 文章目录 欢迎关注WX公众号:【程序员管小亮】一、介绍二、代码实现1_数据加载2_归一化3_定义网络结构4_设置优化器和退火函数5_数据增强6_拟合数据7_训练轮数和批大小8_准确率和损失 三、总结 一、介绍 最近发现了一…

FlyAI图像识别类竞赛:什么蘑菇?

人工智能学习离不开实践的验证,推荐大家可以多在FlyAI-AI竞赛服务平台多参加训练和竞赛,以此来提升自己的能力。FlyAI是为AI开发者提供数据竞赛并支持GPU离线训练的一站式服务平台。每周免费提供项目开源算法样例,支持算法能力变现以及快速的…