《IACycleGAN》

Posted on 2022-06-08 In paper review

任务
出发点
创新点
做法
- 生成模型
  - 生成网络整体loss图示
- 识别网络与生成网络的互相优化
实验
- 数据集
  - 生成模型实施细节
  - 识别模型实施细节

paper: Identity-Aware CycleGAN for Face Photo-Sketch Synthesis and Recognition (arxiv.org)

code: none

任务

真人素描生成与识别

出发点

生成促进识别识别促进生成；

大部分生成方法使得合成图像与原始图像在纹理上保持一致，会导致信息丢失；

大多数生成框架都只能学习两个域之间的关系，其鉴别器只关注照片和草图之间的差异，而不考虑任何特定的识别优化（身份信息）；

创新点

在CycleGAN上加入了感知损失（perceptual loss）,能更好的关注面部的语义信息（眼睛、鼻子）;

使生成模型和识别模型相互优化，生成模型迭代生成更好的图像，Triplet Loss训识别模型；

做法

生成模型

分别给出两个domain的照片（这里输入的是paired数据，这里的paired应该身份paired），其训练目的是获得Gx，Gy两个生成器。

两个识别网络，其目的是使用pretrain好的vggface提取feature做Identity perception loss；

生成器用了《Perceptual losses for real-time style transfer and super-resolution》中的结构；

判别器用了PatchGAN的结构；

生成网络整体loss图示

对抗损失（adversarial loss）

输入图像与生成图像进入判别器进行计算，最小化下式

循环一致性损失（cycle consistency loss）

Gx生成的图像再进入Gy恢复原本domain与最初的输入x计算L1，此loss为pix级，最小化下式

身份保持损失（identity perception loss）

仅使用对抗损失会导致伪影和训练不稳定，需要加更强大的监督；

通过一个pretrain的识别网络（文中选择vggface）分别提取两对（原图与合成图）的feature计算L2，此loss区别于pix级监督，是feature级，文中对于此处的解释是：绘制的草图会有夸张成分以扭曲面部纹理信息，夸大面部特征，完全基于pix重建图像效果不会好；CycleGAN的训练需要进行数据增强操作（resize，flip等）难以实施pix级的监督。

最小化下式