加载中...

生成式对抗网络

发表于2025-09-30|更新于2025-10-24|机器学习

|阅读量:

生成式对抗网络（GAN）

传统的对应的架构，生成架构

用network当作生成器，每一次随机生成对应的z，知道对应的分布是简单的，已知的均匀分布或者是正态分布，network的输出变成复杂的范围。

这样的网络就叫做生成器。

为什么要选择分布？

训练资料是不断录制的影片，影片中小精灵的位置预测。传统的网络预测会让小精灵进行分裂，同样的转角会产生两种不同的结果，两种训练资料，进行两面讨好，就会同时向左向右转。让机器的输出是有几率的为其解决方法。加上一个分布包含向左转和向右转。

当我们的任务需要一点创造性时，同样的输入，多种不同的输出。

让人们进行画图的工作会产生不同的结果，比如画一个红色的眼镜的人。

采用聊天的方法，去生成对应的图片。

这样我们就要生成式对抗网络。

GAN的基础原理

淦

，就是这么读。有很多种的英文字母，取名是很难的。

机器生成二次元人物的脸。

输入一个正态分布，生成一个低维的向量，会生成一个二次元人物的脸，产生一个非常高维的向量，输入不同，输出就会不同。选择一个简单的分布函数。

Discriminator

输入一张图片，输出一个数字，判断一个图片是二次元人物的可能性。只是一个神经网络。

Basic Idea of GAN

因为有天敌，对应的枯叶蝶就会变成枯叶一般。对应的鸟儿也会进化，具有更加高明的手段，比如生成对应的枯叶蝶的纹路，之后还会进化。

Discriminator和对应的genertor会进行博弈。产生更加清晰的二次元人物

对应的生成器与对应的判别器之间会不断的进行对抗，这也就是生成式对抗神经网络的由来。adversarial。这也就是人类的比喻、

算法

如何运作？

初始化是两个network

1.定住生成器G，不断的去训练对应的判别器D。

对真正的二次元任务和对应的产生的二次元人物进行评分。

2.相反的操作，对应的G去欺骗判别器，争取以假乱真。G不断的更新对应的参数，看判别器的评分，两者接起来，当作一个大的network来看。整个大的结果其中某一个输出就是一张大的图片，调整对应的G的参数，不去调试对应的D的对应的参数。只去调整生成器。训练的方法没有什么不同的。对应的目标就越大越好（对应的D的积分）

3.反复的训练

一个训练另一个就不训练。

GAN的理论部分

衡量对应的PG与Pdata之间的相似度。这两者越接近越好。G*越小越好。divergence。对应的计算很难。

从PG和Pdata之间进行抽样。评估两者的分布，之间越接近越好。这两个分布之间的某种距离，越小越好。

只要知道怎么去取样，就有办法去计算距离。

GAN,对应的取样方法。从对应的数据库中取样即可。

用判别器的力量，一大堆数据分别有不同的结果，看到realdata就给他很高的分数，看到生成的图就给他低分。

尝试去训练一个二分类的模型，对应的二分类的模型的分类效果越好，对应的两个实际的和生成的分布之间的差距就会很大，对应的生成的效果就不好，也就是说实际的分布与生成的分布之间的距离是很大的。

相反，对应的二分类的分类效果越差，对应的两个实际的分布与生成的分布之间的差距就很小，对应的生成的分布就比较优秀。

训练一个discriminator，可以直接将divergence换成对应的距离，让这个最大距离的值最小，对应的生成就越逼真。可以获得各种各样的距离。

TIPS FOR GAN

JS divergence。

自然数据与实际数据之间的重叠部分往往非常的少二维空间的两条直线是PG AND PDATA ，对应的重叠往往只是理论上的，实际利用计算是不造成影响的。

对应的只要不重叠，对应的JS的值全都是ln2。

对应的二元分类器往往正确率是百分之百，没有什么意义

Wasserstein distance.

想想我们再开一台推土机，看推土机移动土的平均距离，有很多种的移动方法。穷举所有的推土计划，最小的推土的平均距离就是对应的Wd。

WGAN，对应的距离如何计算呢？

D是一个足够平滑的函数

GAN还是很难训练

G和D必须要齐头并进，否则对应的GAN是完全训练不出来的。网络上有很多对应的生成式对抗网络的代码文件。

GAN生成文字是最困难的。

难点在于不能使用梯度下降来优化对应的模型。对应的函数并不能与对应的模型进行匹配，调整参数会有很多相同的结果，结果可能不会变化，根本没有办法算微分。RL硬做，都很难训练。生成式对抗模型很难。

能不能用监督学习的方法来进行运算，

GAN的评价

1.找人直接来看。

2.人脸侦测的系统，抓到动画人物的人脸的比例

3.几率的分布，影像分类系统的结果比较集中，对应的生成效果就比较好。

4.一张老脸进行模式的复制，都一样，没意思。，这样的评价也需要考虑

5.mode Dropping肤色都变成一样的，降维了。

6.一堆图片都进入CNN，判断对应的而平均分布，集中，多样性不够

7FID,计算当成高斯分布之间的距离

文章作者: 荆树吉

文章链接: http://someinfo.top/2025/09/30/%E7%94%9F%E6%88%90%E5%BC%8F%E5%AF%B9%E6%8A%97%E7%BD%91%E7%BB%9C/

版权声明: 本博客所有文章除特别声明外，均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 JSJ-0513！

生成式对抗网络

数据库加载中