生成式对抗网络(GAN)

传统的对应的架构,生成架构

用network当作生成器,每一次随机生成对应的z,知道对应的分布是简单的,已知的均匀分布或者是正态分布,network的输出变成复杂的范围。

这样的网络就叫做生成器。

为什么要选择分布?

训练资料是不断录制的影片,影片中小精灵的位置预测。传统的网络预测会让小精灵进行分裂,同样的转角会产生两种不同的结果,两种训练资料,进行两面讨好,就会同时向左向右转。让机器的输出是有几率的为其解决方法。加上一个分布包含向左转和向右转。

当我们的任务需要一点创造性时,同样的输入,多种不同的输出。

让人们进行画图的工作会产生不同的结果,比如画一个红色的眼镜的人。

采用聊天的方法,去生成对应的图片。

这样我们就要生成式对抗网络。

GAN的基础原理

,就是这么读。有很多种的英文字母,取名是很难的。

机器生成二次元人物的脸。

输入一个正态分布,生成一个低维的向量,会生成一个二次元人物的脸,产生一个非常高维的向量,输入不同,输出就会不同。选择一个简单的分布函数。

Discriminator

输入一张图片,输出一个数字,判断一个图片是二次元人物的可能性。只是一个神经网络。

image-20250902194941956

Basic Idea of GAN

因为有天敌,对应的枯叶蝶就会变成枯叶一般。对应的鸟儿也会进化,具有更加高明的手段,比如生成对应的枯叶蝶的纹路,之后还会进化。

Discriminator和对应的genertor会进行博弈。产生更加清晰的二次元人物

对应的生成器与对应的判别器之间会不断的进行对抗,这也就是生成式对抗神经网络的由来。adversarial。这也就是人类的比喻、

算法

如何运作?

初始化是两个network

1.定住生成器G,不断的去训练对应的判别器D。

对真正的二次元任务和对应的产生的二次元人物进行评分。

2.相反的操作,对应的G去欺骗判别器,争取以假乱真。G不断的更新对应的参数,看判别器的评分,两者接起来,当作一个大的network来看。整个大的结果其中某一个输出就是一张大的图片,调整对应的G的参数,不去调试对应的D的对应的参数。只去调整生成器。训练的方法没有什么不同的。对应的目标就越大越好(对应的D的积分)

3.反复的训练

一个训练另一个就不训练。

image-20250902200558561

GAN的理论部分

image-20250902202005160

衡量对应的PG与Pdata之间的相似度。这两者越接近越好。G*越小越好。divergence。对应的计算很难。

从PG和Pdata之间进行抽样。评估两者的分布,之间越接近越好。这两个分布之间的某种距离,越小越好。

只要知道怎么去取样,就有办法去计算距离。

GAN,对应的取样方法。从对应的数据库中取样即可。

image-20250903155651525

用判别器的力量,一大堆数据分别有不同的结果,看到realdata就给他很高的分数,看到生成的图就给他低分。

尝试去训练一个二分类的模型,对应的二分类的模型的分类效果越好,对应的两个实际的和生成的分布之间的差距就会很大,对应的生成的效果就不好,也就是说实际的分布与生成的分布之间的距离是很大的。

相反,对应的二分类的分类效果越差,对应的两个实际的分布与生成的分布之间的差距就很小,对应的生成的分布就比较优秀。

训练一个discriminator,可以直接将divergence换成对应的距离,让这个最大距离的值最小,对应的生成就越逼真。可以获得各种各样的距离。

TIPS FOR GAN

JS divergence。

自然数据与实际数据之间的重叠部分往往非常的少 二维空间的两条直线是PG AND PDATA ,对应的重叠往往只是理论上的,实际利用计算是不造成影响的。

image-20250903162521995

对应的只要不重叠,对应的JS的值全都是ln2。

对应的二元分类器往往正确率是百分之百,没有什么意义

Wasserstein distance.

想想我们再开一台推土机,看推土机移动土的平均距离,有很多种的移动方法。穷举所有的推土计划,最小的推土的平均距离就是对应的Wd。

image-20250903163402461

WGAN,对应的距离如何计算呢?

image-20250903163800359

D是一个足够平滑的函数

GAN还是很难训练

G和D必须要齐头并进,否则对应的GAN是完全训练不出来的。网络上有很多对应的生成式对抗网络的代码文件。

GAN生成文字是最困难的。

难点在于不能使用梯度下降来优化对应的模型。对应的函数并不能与对应的模型进行匹配,调整参数会有很多相同的结果,结果可能不会变化,根本没有办法算微分。RL硬做,都很难训练。生成式对抗模型很难。

能不能用监督学习的方法来进行运算,

GAN的评价

1.找人直接来看。

2.人脸侦测的系统,抓到动画人物的人脸的比例

3.几率的分布,影像分类系统的结果比较集中,对应的生成效果就比较好。

4.一张老脸进行模式的复制,都一样,没意思。,这样的评价也需要考虑

5.mode Dropping肤色都变成一样的,降维了。

6.一堆图片都进入CNN,判断对应的而平均分布,集中,多样性不够

7FID,计算当成高斯分布之间的距离