热搜:

这款叫做“FaceBlit”的最新的风格迁移技术,能够实时把镜头前你的脸变成指定画像的风格,还能匹配你的表情动作。

性别不同也没问题。

甚至可以用雕像和草稿。

这一切都能在手机上实时进行,不需要拍好视频再等待处理。这意味着,本项技术可以应用于直播和视频通话,而不仅是上传拍好的视频作品。

它还可以反过来用,通过镜头捕捉你的表情动作,让画像同步动起来。

来看看这么惊艳的效果是如何做到的吧。

位置匹配+外观匹配

首先是位置匹配,通过下巴的轮廓确定整个面部的形状。检测出五官等重要面部特征并编码。

再把画像与人脸的面部特征进行匹配,确保迁移的结果在语义上能够一一对应。既鼻子对鼻子,眼对眼。

然后是外观匹配,先把画像与人脸都去掉颜色进行灰度化,再进行高斯模糊处理。

用原始图像减去模糊后的图像得到其差值图像。以差值图像为依据进行直方图匹配(Histogram Match)。

从对比图中可以看到,位置匹配和外观匹配共同作用才能得到理想的结果。

为什么这么快?

风格迁移其实已经有很多方案,但使FaceBlit脱颖而出的最大的特点就在于速度快,无需大规模数据集和长时间训练。

在19年的前期成果中已经能做到在十几秒内训练出稳定的效果。

FaceBlit将Fi?er等人在2017年提出方法中的4个匹配简化成两个,即上面提到的位置匹配和外观匹配,并改进底层生成算法,将准备时间缩短到几十毫秒。

检测面部特征时使用下采样(subsample),在对检测精度影响很小的情况下降低图片的分辨率。

通过预计算3D像素查找表,以占用更多内存为代价节省时间,并将搜索范围限制在目标位置的20个像素以内。

最终在性能测试中,FaceBlit通过稍微提高预计算时间,大大减少了合成时间。这意味着,完成对参考画像的预计算后,就可以实时合成出所需的图像。

还是在只使用了CPU的情况下。

在使用三星Note 8手机的测试中,FaceBlit在50万像素分辨率下以每秒15帧运行。

进一步研究方向

研究团队表示,虽然FaceBlit效果已经很惊艳,但还不够完美,并提出了3个未来的研究方向。

解决由于在计算过程中省略了对时间一致性的匹配,导致生成结果中会出现闪烁的问题。

解决外观匹配方法容易在风格迁移中忽略一些大尺度的特征的问题。

通过交叉分析相似风格的同一套画像,来使结果能适应不同观察角度、照明条件等复杂情况。

作者团队

这项研究一作为来自捷克理工大学的Aneta Texler, Ond?ej Texler和Michal Ku?era。

另外还有来自相机社交应用公司Snap的华人研究员柴蒙磊参与其中。

柴蒙磊博士毕业于浙江大学。主要从事计算机视觉和计算机图形学的研究,主攻人类数字化、图像处理、三维重建和基于物理的动画。