新智元推荐
来源:OpenAI
编译:文强
OpenAI最新提出的可逆生成模型Glow,可以使用相对少的数据,快速生成高清的逼真图像,具有GAN和VAE所不具备的精确操作潜在变量、需要内存少等优势。
OpenAI刚刚在博客介绍了他们的最新成果——Glow,一种使用可逆1x1卷积的可逆生成模型。
Glow可以生成逼真的高分辨率图像,支持高效采样,并且可以自动学习图像中属性特征,比如人的五官。
先来看效果,加了胡子的Hinton,笑容调到最高,眼神也看起来更亮:
下图是使用Glow操纵两名研究人员面部图像的属性。模型在训练的时候并没有给出眼睛、年龄等属性标签,但自己学习了一个潜在空间,其中某些方向对应胡须密度,年龄,发色等属性的变化。
人脸混合过度的效果也十分自然:
这是使用30,个高分辨率面部数据集进行训练后,Glow模型中的样本,可以说很逼真了。如果不说明,应该有不少人会觉得是真人照片。
再放大来看,这个效果至少是不输给GAN的:
Glow模型生成一个x的样本,在NVIDIATiGPU上只需要大约ms。使用reduced-temperature模型采样结果更好,上面展示的例子是温度0.7的结果。
数据利用率高,可泛化,优于GAN和VAEGlow是一种可逆生成模型(reversiblegenerativemodel),也被称为基于流的生成模型(flow-basedgenerativemodel)。目前,学界还很少