CycleGAN与pix2pix训练自己的数据集-Pytorch

article/2025/8/27 1:34:20

github：https://github.com/junyanz/pytorch-CycleGAN-and-pix2pix
参考：https://blog.csdn.net/Gavinmiaoc/article/details/80585531

文章目录

Cyclegan
- Download&Prerequisites
- before your work
- 数据集
- 训练
- 测试
pix2pix
- 数据集
- 训练
- 测试

Cyclegan

Download&Prerequisites

Linux或macOS
Python 3
CPU或NVIDIA GPU + CUDA CuDNN

安装[PyTorch]（http://pytorch.org和）0.4+和其他依赖项（例如，torchvision，visdom和dominate）。

对于pip用户，请输入命令pip install -r requirements.txt。
对于Conda用户，我们提供安装脚本./scripts/conda_deps.sh。或者，您可以使用创建新的Conda环境conda env create -f environment.yml。

导入torch出错解决->https://blog.csdn.net/frothmoon/article/details/90321926

git clone https://github.com/junyanz/pytorch-CycleGAN-and-pix2pix
cd pytorch-CycleGAN-and-pix2pixpip install visdom
pip install dominate

before your work

作者提供了关于数据集测试训练的tip可以根据自身情况修改相应的参数，强烈建议读完在做

数据集

未配对和成对的图像到图像转换提供PyTorch实现
可下载示例bash ./datasets/download_cyclegan_dataset.sh maps，根据示例然后将自己的数据集配置成相同的格式
训练自己的CycleGAN,需要在datasets目录下新建两个文件夹 trainA 和trainB，同时为了后面的测试，可以再建testA,testB，完整目录展示如下：
在这里插入图片描述
图像转换的方向就是A==>B，所以trainA是要处理的图片，trainB是处理的目标图片

训练

预训练模型详见github库readme文件
可视化python3 -m visdom.server URL http://localhost:8097
我自己运行时这里python -m visdom.server出错解决方法->https://blog.csdn.net/frothmoon/article/details/90321926
训练命令（根据自身情况修改进行训练）

python3 train.py --dataroot ./datasets/mosaic --name mosaic_cyclegan --model cycle_gan --pool_size 50 --no_dropout --gpu_ids 0,1

要查看更多中间结果，请查看./checkpoints/maps_cyclegan/web/index.html

测试

#!./scripts/train_cyclegan.sh
python train.py --dataroot ./datasets/maps --name maps_cyclegan --model cycle_gan

测试结果将保存到html文件中：./results/maps_cyclegan/latest_test/index.html

贴张自己数据集的图：
在这里插入图片描述

pix2pix

数据集

官方原数据集下载bash ./datasets/download_pix2pix_dataset.sh facades需要据此配置自己的
一对A、B中对应的图像必须大小相同，文件名相同
我们同样在./datasets/mosaic文件夹下新建两个文件夹，A 和B，然后在它们各自目录下再建三个folder，test，train，val（非必需）
最后将训练数据放到各自的train下，测试的在test下，验证在val下
使用以下代码生成图像对：

python3 datasets/combine_A_and_B.py --fold_A ./mosaic/A --fold_B ./mosaic/B --fold_AB ./mosaic

如图：
在这里插入图片描述

训练

预训练模型详见github库readme文件
可视化步骤与上述CycleGAN相同

python3 train.py --dataroot ./datasets/mosaic --name mosaic_pix2pix --model pix2pix --which_model_netG unet_256 --which_direction AtoB --lambda_B 100 --dataset_mode aligned --no_lsgan --norm batch --pool_size 0

要查看更多中间结果，请查看./checkpoints/facades_pix2pix/web/index.html

测试

#!./scripts/test_pix2pix.sh
python test.py --dataroot ./datasets/facades --name facades_pix2pix --model pix2pix --which_model_netG unet_256 --which_direction BtoA --dataset_mode aligned --norm batch

测试结果将保存到html文件中：./results/facades_pix2pix/test_latest/index.html。您可以在scripts目录中找到更多脚本。
贴张自己数据集的图：
在这里插入图片描述