生成对抗网络 (gan) 通过涉及两个网络的过程生成图像或视频: 生成器和鉴别器。生成器创建合成数据 (例如,图像),而鉴别器通过将生成的数据与真实样本区分开来评估生成的数据的真实性。这种对抗性设置允许生成器随着时间的推移而改进,产生越来越现实的输出。
生成器以随机噪声 (例如,高斯噪声) 作为输入开始,并且使用一系列变换来创建类似于目标域的结构化输出。例如,在图像生成中,生成器学习通过针对鉴别器的反馈进行优化来将噪声映射到详细图像中。在鉴别器的分类错误的指导下,每次迭代都提高了生成器模拟真实数据的能力。
Gan还可以通过扩展生成器的架构来处理时间信息来生成视频。像3D卷积或递归层这样的技术使生成器能够对时间相关模式进行建模。例如,在视频数据上训练的GAN可以学习生成平滑过渡和逼真的运动序列。尽管具有强大的功能,但gan需要仔细的培训以避免诸如模式崩溃之类的问题,在这种情况下,生成器会产生有限的输出变化。