对抗生成网络（Generative Adversarial Net)

article/2025/9/24 19:23:36

好久没有更新博客了，但似乎我每次更新博客的时候都这么说（泪）。最近对生活有了一些新的体会，工作上面，新的环境总算是适应了，知道了如何摆正工作和生活之间的关系，如何能在有效率工作的同时还能继续做自己感兴趣的事情。心理上，我依然故我般的做那个简单的技术boy，生活态度偏理想化但可以直面现实……

突然想到这是一片技术博客，还是不多说自己的事情了，说一说甚嚣尘上的对抗网络吧。

引入

Discriminative Model的繁荣发展

最近，深度学习在很多领域的突破性进展想必不用我多说了。但大家似乎发现了这样的一个现实，即深度学习取得突破性进展的地方貌似都是discriminative的模型。

所谓的discriminative可以简单的认为是分类问题，比如给一张图片，判断这张图片上有什么动物；再比如给定一段语音，判断这段语音所对应的文字。

在discriminative的模型上，有很多行之有效的方法，如反向传播，dropout，piecewise linear units等技术。

Generative Model

其实，这篇论文很早之前就看了，但我对生成模型在AI里的地位一直不能特别直观的感受。最近才慢慢的理解。

从细节上来看，生成模型可以做一些无中生有的事情。比如图片的高清化，遮住图片的一部分去修复，再或者画了一幅人脸的肖像轮廓，将其渲染成栩栩如生的照片等等。

再提高一层，生成模型的终极是创造，通过发现数据里的规律来生产一些东西，这就和真正的人工智能对应起来了。想想一个人，他可以通过看，听，闻去感知这世界，这是所谓的Discriminative，他也可以说，画，想一些新的事情，这就是创造。所以，生成模型我认为是AI在识别任务发展相当成熟之后的AI发展的又一个阶段。

借东风

但是现在，生成模型还没有体会到深度学习的利好，在Discriminative模型上，成果如雨后春笋，但在生成模型上，却并非如此。原因如下：

在最大似然估计及相关策略上，很多概率计算的模拟非常难
将piecewise linear units用在生成模型上比较难

那么，是不是生成模型就借不了深度学习发展的东风了呢？我只能说，有的时候，不得不曲线救国。

对抗网络

基本思想

假设有一种概率分布M，它相对于我们是一个黑盒子。为了了解这个黑盒子中的东西是什么，我们构建了两个东西G和D，G是另一种我们完全知道的概率分布，D用来区分一个事件是由黑盒子中那个不知道的东西产生的还是由我们自己设的G产生的。

不断的调整G和D，直到D不能把事件区分出来为止。在调整过程中，需要：

优化G，使它尽可能的让D混淆。
优化D，使它尽可能的能区分出假冒的东西。

当D无法区分出事件的来源的时候，可以认为，G和M是一样的。从而，我们就了解到了黑盒子中的东西。

简单的例子说明

在这里插入图片描述

且看上面四张图a,b,c,d. 黑色的点状线代表M所产生的一些数据，红色的线代表我们自己模拟的分布G，蓝色的线代表着分类模型D。

a图表示初始状态，b图表示，保持G不动，优化D，直到分类的准确率最高。
c图表示保持D不动，优化G，直到混淆程度最高。d图表示，多次迭代后，终于使得G能够完全你和M产生的数据，从而认为，G就是M。

形式化

在这里插入图片描述
将上述例子所描述的过程公式化，得到如上公式。公式中D(x)表示x属于分布M的概率，因而，优化D的时候就是让V(D,G)最大，优化G的时候就是让V(D,G)最小。

其中，x~p_data(x) 表示x取自真正的分布。
z~p_z(z) 表示z取自我们模拟的分布。G表示生成模型，D表示分类模型。

在这里插入图片描述
上述即是G和D的训练过程。其中在每次迭代中，梯度下降K次来训练D，然后梯度下降一次来训练G，之所以这样做，是因为D的训练是一个非常耗时的操作，且在有限的集合上，训练次数过多容易过拟合。

证明

这篇论文中的思想就如上所述，但是有意思的是还有两个证明来从理论上论证了对抗网络的合理性。

命题一

第一个证明是，当G固定的时候，D会有唯一的最优解。真实描述如下：

在这里插入图片描述

证明如下：

首先，对V(G,D)进行变换
对于任意的a,b ∈ R² \ {0, 0}, 下面的式子在a/(a+b)处达到最优。

得证！

定理一

根据证明一，可以对V(G,D)中最大化D的步骤进行变换。

在这里插入图片描述

从而得到定理
在这里插入图片描述

直接带入p_g=p_data可得-log4，当入p_g!=p_data时，得到

在这里插入图片描述

命题二

命题二原文如下：

在这里插入图片描述
这个定理的证明需要用到凸函数的某个似乎是很明显的定理，即，通过凸函数的上确界的次导数可以找到函数在最大值时的导数。这个理论应用到G和D中就是在G不变时，D是拥有唯一的最优值的凸函数，因而可以得到。但因为我对凸优化理论尚不熟悉，所以没有理解透彻这个地方。

实验

早期的训练中，D可以很轻松的分辨出来G和M中不同的样本，从而会饱和，所以用logD(G(z))来代替log(1-D(G(z)),这样可以为早期的学习提供更加好的梯度。

实验就是去拟合Guassian Parzen Windown，具体细节略过。结果如下：

在这里插入图片描述

优势和劣势

优势：

Markov链不需要了，只需要后向传播就可以了。
生成网络不需要直接用样本来更新了，这是一个可能存在的优势。
对抗网络的表达能力更强劲，而基于Markov链的模型需要分布比较模糊才能在不同的模式间混合。

劣势：

对于生成模型，没有直接的表达，而是由一些参数控制。
D需要和G同步的很好才可以。

各种生成模型的对比如下：

在这里插入图片描述

参考

Ian J. Goodfellow. Generative Adversarial Nets.
深度 | OpenAI Ian Goodfellow的Quora问答：高歌猛进的机器学习人生
生成式对抗网络GAN研究进展（二）——原始GAN

更多文章欢迎关注公众号【雨石记】。

http://chatgpt.dhexx.cn/article/fF6uCvSy.shtml

相关文章

【PaddleOCR-det-finetune】一：基于PPOCRv3的det检测模型finetune训练

【PaddleOCR-det-finetune】一：基于PPOCRv3的det检测模型finetune训练

文章目录基本流程详细步骤打标签，构建自己的数据集下载PPOCRv3训练模型修改超参数，训练自己数据集启动训练导出模型测试相关参考手册在PaddleOCR项目工程中的位置： det模型训练和微调：PaddleOCR\doc\doc_ch\PPOCRv3_det_train.…

阅读更多...

模型微调（Finetune）

模型微调（Finetune）

参考：https://zhuanlan.zhihu.com/p/35890660 ppt下载地址：https://github.com/jiangzhubo/What-is-Fine-tuning 一.什么是模型微调给定预训练模型（Pre_trained model）,基于模型进行微调（Fine Tune）。相…

阅读更多...

fine-tuning

fine-tuning

微调（fine-tuning） 在平时的训练中，我们通常很难拿到大量的数据，并且由于大量的数据，如果一旦有调整，重新训练网络是十分复杂的，而且参数不好调整，数量也不够，所以我们可…

阅读更多...

大模型的三大法宝：Finetune, Prompt Engineering, Reward

大模型的三大法宝：Finetune, Prompt Engineering, Reward

编者按：基于基础通用模型构建领域或企业特有模型是目前趋势。本文简明介绍了最大化挖掘语言模型潜力的三大法宝——Finetune, Prompt Engineering和RLHF——的基本概念，并指出了大模型微调面临的工具层面的挑战。以下是译文，Enjoy! 作者 | B…

阅读更多...

RCNN网络源码解读（Ⅲ） --- finetune训练过程

RCNN网络源码解读（Ⅲ） --- finetune训练过程

目录 0.回顾 1.finetune二分类代码解释（finetune.py） 1.1 load_data（定义获取数据的方法） 1.2 CustomFineTuneDataset类 1.3 custom_batch_sampler类（ custom_batch_sampler.py） 1.4 训练train_mod…

阅读更多...

FinSH

FinSH

finSH介绍 FinSH 是 RT-Thread 的命令行组件，提供一套供用户在命令行调用的操作接口，主要用于调试或查看系统信息。它可以使用串口 / 以太网 / USB 等与 PC 机进行通信。命令执行过程功能: 支持鉴权，可在系统配置中选择打开/关闭。(TODO…

阅读更多...

从统一视角看各类高效finetune方法

从统一视角看各类高效finetune方法

每天给你送来NLP技术干货！ 来自：圆圆的算法笔记随着预训练模型参数量越来越大，迁移学习的成本越来越高，parameter-efficient tuning成为一个热点研究方向。在以前我们在下游任务使用预训练大模型，一般需要finetune模型…

阅读更多...

finetune

finetune

finetune的含义是获取预训练好的网络的部分结构和权重，与自己新增的网络部分一起训练。下面介绍几种finetune的方法。完整代码：https://github.com/toyow/learn_tensorflow/tree/master/finetune 一，如何恢复预训练的网络方法一&#xf…

阅读更多...

11.2 模型finetune

11.2 模型finetune

一、Transform Learning 与 Model Finetune 二、pytorch中的Finetune 一、Transfer Learning 与 Model Finetune 1. 什么是Transfer Learning? 迁移学习是机器学习的一个分支，主要研究源域的知识如何应用到目标域当中。迁移学习是一个很大的概念。怎么理解源域…

阅读更多...

飞桨深度学习学院零基础深度学习7日入门-CV疫情特辑学习笔记（四）DAY03 车牌识别

飞桨深度学习学院零基础深度学习7日入门-CV疫情特辑学习笔记（四）DAY03 车牌识别

本课分为理论和实战两个部分理论：卷积神经网络 1.思考全连接神经网络的问题一般来收机器学习模型实践分为三个步骤，（1）建立模型 （2）选择损失函数 （3）参数调整学习 1.1 模型结构不…

阅读更多...

unity sdk（android）-友盟推送SDK接入

unity sdk（android）-友盟推送SDK接入

注意：一开始想接友盟Unity的SDk，但是导入后缺少各种jar，所以最后还是接了android的，demo文档齐全官方文档：开发者中心按照官方文档对接即可， 接入流程 1、项目中com.android.tools.build:gradle配置&…

阅读更多...

友盟推送学习

友盟推送学习

一、首次使用U_Push 1、首先注册友盟账号，进入工作台，选择产品U_Push。 2、创建应用 3、在自己的项目中自动集成SDK 开发环境要求： Android Studio 3.0以上 Android minSdkVersion: 14 Cradle: 4.4以上在根目录build.gradle中添加mav…

阅读更多...

Android 学习之如何集成友盟推送

Android 学习之如何集成友盟推送

我是利用Android studio 新建一个空的Android项目。步骤一导入第三方库 1.切换Android项目状态为Project状态 2.在main文件下新建 jniLibs文件夹（用来导入PushSDK项目下lib文件中的so文件） 3.在libs文件夹下添加友盟PuskSDK中的 jar 文件&#xff…

阅读更多...

用PaddlePaddle（飞浆）实现车牌识别

用PaddlePaddle（飞浆）实现车牌识别

项目描述：本次实践是一个多分类任务，需要将照片中的每个字符分别进行识别，完成车牌的识别实践平台：百度AI实训平台-AI Studio、PaddlePaddle1.8.0 动态图数据集介绍（自己去网上下载车牌识别数据集） 数据…

阅读更多...

深度学习(五) CNN卷积神经网络

深度学习(五) CNN卷积神经网络

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档 CNN卷积神经网络前言一、CNN是什么？二、为什么要使用CNN？三、CNN的结构1.图片的结构2.卷积层1.感受野（Receptive Field）2.卷积…

阅读更多...

CNN网络实现手写数字（MNIST）识别代码分析

CNN网络实现手写数字（MNIST）识别代码分析

CNN网络实现手写数字（MNIST）识别代码分析(自学用) Github代码源文件本文是学习了使用Pytorch框架的CNN网络实现手写数字（MNIST）识别 #导入需要的包 import numpy as np //第三方库，用于进行科学计算 import torc…

阅读更多...

Android删除chartty证书,C/C++知识点之android应用安全分析

Android删除chartty证书,C/C++知识点之android应用安全分析

本文主要向大家介绍了C/C知识点之android应用安全分析，通过具体的内容向大家展示，希望对大家学习C/C知识点有所帮助。应用名 ：OKEx(OKEx-android.apk) 包名 ：com.okinc.okex MD5 ：1ffbd328d13e91b661592cdf58516bd2 版…

阅读更多...

代码编写过程 - 正确率折线图

代码编写过程 - 正确率折线图

获取绘图函数首先，看到需要画acc和loss图。先去参考现成的，于是打开猫12分类，找到生成折线图的地方。发现框内的两个函数绘制了折线图。既然是作为函数出现，说明已经有一定的封装，考虑能不能把整个函数搬走用。由…

阅读更多...

李宏毅机器学习课程HW03代码解释

李宏毅机器学习课程HW03代码解释

作业3任务是将图片进行分类从官网上下载数据到data文件里面。此外，将代码分为三个模块，分别是dataset,model以及main。一、dataset模块此模块作用是读取图片数据。重要函数：os.path.join(path,x) 将path和x路径组合在一起 #导入库…

阅读更多...

接入友盟厂商push通道遇到的坑

接入友盟厂商push通道遇到的坑

目录调试友盟Push问题的检查清单客户端、服务端数据协议客户端接入方式小米厂商通道华为厂商通道魅族厂商通道 VIVO厂商通道 OPPO厂商通道支持桌面角标的厂商吐槽一下集成友盟厂商通道时发现的问题调试友盟Push问题的检查清单过滤UmengPushAgent开头的日志…

阅读更多...

推荐文章