基于GAN的“真人捏脸”已上线，照片逼真无死角：脸型、五官、表情等均可控制

萧箫 2020-12-17 17:38:06 来源：量子位

用3D模型参数，控制2D人脸生成

萧箫发自凹非寺
量子位报道 | 公众号 QbitAI

使用GAN生成的2D人脸模型很美丽，然而却终究缺了点什么？

060a245c4d6540778849025f6b116ee5~tplv-tt-shrink:640:0.image

没错，虽然GAN能生成逼真的人脸，但距离自己理想的人脸，总有那么一点不完美——面部表情、脸上皱纹、发质……

由于GAN没办法进行参数调控，即使人脸再逼真，也没办法控制五官等细节。

现在，一个新模型GIF （Generative Interpretable Faces）的出现打破了这一定律：

不仅能用GAN生成逼真的人脸，而且还能通过具体的参数控制它。

8cee57890eb94020aa98c248de990f73~tplv-tt-shrink:640:0.image

这是怎么做到的？

用3D模型的参数，控制2D照片

目前的3D和2D人脸生成模型，在真实性和参数可控这两方面，有着很大的差异。

3D人脸的参数可以分为几种：脸型变化、姿势差异、表情变化。

0d46eeeda2f34581b7cf911ca6e236ca~tplv-tt-shrink:640:0.image

然而，目前生成的3D人脸模型普遍存在一个问题：与真实的人脸相差甚远。

因为无论是头发、眼睛、肤质（皱纹）或者口腔（牙齿、舌头），目前的3D人脸模型都难以进行真实的模拟。

225ae17392a344e198f43c5aa7679750~tplv-tt-shrink:640:0.image

与之相反的是，2D人脸生成模型（如目前很火的StyleGAN、StyleGAN2等）虽然能实现照片级模拟，但却没办法独立更改如面部外观、形状或表情等参数。

d512dda2993844bda6a0f96c5ed5dc51~tplv-tt-shrink:640:0.image

那么，有没有办法将这两类人脸模型的优势结合起来，利用3D模型的参数控制，生成可以控制具体环节的2D照片呢？

抱着这样的想法，研究者们将2D人脸生成模型StyleGAN2，与一个名为FLAME的3D人脸生成模型进行了结合，如下图所示。

fc56f86598fe4ad2bd3b4304b3d79298~tplv-tt-shrink:640:0.image

原本在StyleGAN2中，会插入一部分随机噪音，用于调节局部纹理的变化，现在则是将FLAME模型生成的纹理和常规渲染当做这个噪声，输入StyleGAN2中，以对生成的图像产生直接影响。

在这其中，生成的图像会被投影到3D人脸生成模型的网格（mesh）上，获得一个不完整的纹理图，也就是所谓的“纹理窃取”（texture stealing）。

从下图可见，“纹理窃取”看起来就像是把人脸分成了几部分，强行进行了拼凑。

367b1a6004b540c5af084f2e63155e30~tplv-tt-shrink:640:0.image

事实上，这是用3D模型，来对人脸进行参数控制的重要步骤。在进行像素对齐后，模型参数与生成图像之间的像素局部关联就能变得明确。

也就是说，这一生成模型不仅能利用GAN的特性，生成逼真的人脸图像，还能根据3D模型给出的参数，进行人脸细节的调控。

aeec7bf2dada4bebadb054b7196ae691~tplv-tt-shrink:640:0.image

那么，这一模型的效果具体如何呢？

各种细节都能变

从控制情况来看，参数对人脸模型的控制还是不错的。

下图是改变参数对人脸造成的影响。

与第一行相比，第二行改变了发型，第三行主要改变了个人身份，第四行改变了五官参数，第五行改变了姿势，第六行改变了外观，第七行则是对肤色和光照角度的改变。

9a499a9978d8403dad0d12fd8dff4d63~tplv-tt-shrink:640:0.image

可以看出，参数对于人脸的控制还是比较明显的。

如果想不好要生成什么样的人脸，也可以用随机采样的模式。

从下图可以看出，从年龄、肤色、表情、姿势等来看，模型也保留了GAN的效果，生成的人脸图像也具有非常大的差异性，但无一例外都比较逼真。

7ccf7862a3a84d1dbca558cf5d16823f~tplv-tt-shrink:640:0.image

当然，GAN该有的那些玩法，这个模型也有，不仅能生成口对口动画，还能与语音相结合生成演讲模型。

d413df29b9d44bdc8480f31d64ab79eb~tplv-tt-shrink:640:0.image

具体到图像质量，GIF的FID得分也非常不错（数值越低越好）。

96048d31efb149218ecec9f19cf9fa04~tplv-tt-shrink:640:0.image

相比于动画捏脸模型，这个GAN版捏脸模型，可以说是非常逼真了。

9e548bc9f49f44db8b62ccd362977f50~tplv-tt-shrink:640:0.image

一作Partha Ghosh，来自马普所，研究领域涉及计算机视觉、计算机图形学和机器学习的交叉学科，教计算机如何看待和理解人类行为。

二作Pravir Singh Gupta，来自德州农工大学，目前是一名博士生。共同二作Roy Uziel，来自内盖夫本-古里安大学，目前在马普所实习。

此外，作者还有Anurag Ranjan、Michael Black和Timo Bolkart，他们都来自马普所。

目前代码已经开源，动动手指，捏出你理想中的人脸模型吧~

代码地址：
https://github.com/ParthaEth/GIF

论文地址：
https://arxiv.org/abs/2009.00149

基于GAN的"真人捏脸"已上线，照片逼真无死角：脸型、五官、表情等均可控制...

基于GAN的“真人捏脸”已上线，照片逼真无死角：脸型、五官、表情等均可控制

用3D模型的参数，控制2D照片

各种细节都能变

Recommend

智能开关实现远程遥控！浙江移动助力5G+智慧电力新突破_5G资讯_中国IDC圈

粤港澳大湾区大数据中心建设与数据要素市场培育研讨会成功举办_大数据资讯_中国IDC圈

斯图加特Hawk超级计算机添加192块英伟达GPU 助力人工智能_IDC国际资讯_中国IDC圈

第三季度以太网交换机和路由器市场表现参差不齐_IDC国内资讯_中国IDC圈

信通院5G发展白皮书：今年5G将带动经济产出8109亿_5G新知_中国IDC圈

中国石化行业首个5G专网项目在海南炼化正式投用_5G资讯_中国IDC圈

10年后6G到来多数指标是5G的10倍_5G新知_中国IDC圈

科华恒盛与包钢股份签署战略合作协议打造数字化转型新格局_IDC国内资讯_中国IDC圈

台达出席“中国数据中心设施论坛”易动-超越与VR结合带来全新展台体验_IDC国内资讯_中...

Vertiv专家预测：2021年数据中心的重要性将近似民生类基建_IDC国际资讯_中国IDC圈

About Joyk