这两年随着像Tiktok,SnapChat这一类短视频平台的流行,风格转换类的算法在这类平台上也得到了广泛的应用,深受用户喜爱。比如snapchat中的卡通画人脸,变小孩,变光头等一类滤镜,其视觉效果都非常棒,在社交媒体上也被广泛传播。这类人脸风格化滤镜的底层算法是基于GAN(生成对抗网络)研发而成的。而在GAN被广泛商业化应用的道路上,有两篇非常重要的工作,分别是 Pix2Pix,和 StyleGAN,这两篇工作GAN被商业化成为了可能。
本文主要是介绍两篇工作的一篇 StyleGAN。
StyleGAN (A Style-Based Generator Architecture for Generative Adversarial Networks 2018)
StyleGAN是有NVIDIA于2018年提出的,截止2022年3月有3825次引用。
StyleGAN网络主要分成两个部分,分别是Mapping Network 和 Synthesis Network。结构图如下:
如上图所示:
- Mapping Network:映射网络,它的结构比较简单;由8个全连接层组成,网络输入为 512x1 的向量,输出也是 512x1的向量。