9

一举打败16个同类模型,视频超分比赛冠军算法入选CVPR 2022,来自商汤&南洋理工大...

 2 years ago
source link: https://www.qbitai.com/2022/03/33137.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

一举打败16个同类模型,视频超分比赛冠军算法入选CVPR 2022,来自商汤&南洋理工大学

head.jpg丰色 2022-03-06 12:26:27 来源:量子位

NTIRE 2021三冠一亚

如何让模糊的老片变高清?

AI的答案是超分辨率算法。

现在,在视频超分领域,有一个强大的算法拿下了超分比赛NTIRE 2021三冠一亚的优异成绩,登上了CVPR 2022。

f3e61d68a82148429a5e2127e749ddba~tplv-tt-shrink:640:0.image

它的名字叫做BasicVSR++,是对视频超分SOTA模型BasicVSR的进一步改进。

BasicVSR也曾拿下NTIRE冠军,入选CVPR 2021。

现在,这个BasicVSR+++在基本相同的参数量下,不仅性能大幅超过前辈,PSNR(峰值信噪比,图像质量评估指标)提高了0.82dB,还能应用到更多的视频复原任务中(例如压缩视频增强)。

07e72e00b622491499aae8006a3ad80c~tplv-tt-shrink:640:0.image

加强版BasicVSR

BasicVSR采用双向传播(propagation)+特征对齐方式,能够提取整个输入视频中的有效信息进行超分。

但是,它这一基本设计也限制了信息聚合的功效,比如难以恢复精细的细节,尤其是在处理复杂的遮挡区域时。

因此,加强版的BasicVSR++在传播和对齐方面进行了重新改造,采用了二阶网格传播(second-order grid propagation) 和光流引导可变形对齐 (flow-guided deformable alignment)的设计来改善网络中的信息聚合能力,提升遮挡区域的鲁棒性和有效性。

3ce1c3de39344f75afb6d5195d8de097~tplv-tt-shrink:640:0.image

其中,二阶网格可以让信息从不同的时空位置进行前向后后向传播,让特征的传播更有效。

光流引导可变形对齐则可以让帧进行更具鲁棒性的特征对齐。

采用这一对齐方式主要是单纯的形变对齐训练效果不稳定,尽管可变形卷积 (DCN) 网络中具备多样性的偏移量(offset)使形变对齐的性能优于光流对齐。

BasicVSR+++具体架构如下:

4358189d939a4a458bfc919dd05bfe0d~tplv-tt-shrink:640:0.image

给定输入视频,首先采用残差模块对每一帧提取特征;然后这些特征在二阶网络传播中进行信息传播,其中对齐部分采用光流引导形变对齐;完成信息传播后,汇聚特征生成输出图像。

在16个同类算法中性能全部最佳

作者对比了16种不同视频超分算法的性能、参数量以及耗时,结果是BasicVSR++在所有数据集下的两种退化方式中均取得最佳性能(红色代表最佳分数,蓝色代表次佳分数)。

cd04b807d18345389f079bffe6a26b6c~tplv-tt-shrink:640:0.image

特别地,相比大容量滑动窗口算法EDSR,BasicVSR++获得了1.3dB的性能提升,同时参数量少65%;

相比之前的最新技术IconVSR,BasicVSR++在参数量更少的同时也带来了1dB的性能提升。

更轻量版的BasicVSR++ (S),相比前辈BasicVSR,也有0.82dB的提升,收益显著。

95e1aaa9fcf142c98f050032de9c21a8~tplv-tt-shrink:640:0.image

而在具体效果中,不管是在REDS4、Vimeo-90K-T还是Vid4数据集上,BasicVSR++都能对极细节的图像进行复原,且效果最好。

c2bee16c2c3b4f8cbb387a25b81fe14d~tplv-tt-shrink:640:0.image
9178e2b33ce84167aa59c09b9aa74c9a~tplv-tt-shrink:640:0.image
97bc58460db84e68b2f338db5a9a56af~tplv-tt-shrink:640:0.image

目前,BasicVSR++的代码已经开源,感兴趣的同学可以去试试。

6eb7c1577f204df0ab3098c590cfa06b~tplv-tt-shrink:640:0.image

一作陈焯杰 (Kelvin C.K. Chan) 来自南洋理工大学计算机科学与工程学院,博士三年级在读,本硕毕业于香港中文大学。

目前的研究方向为图像/视频恢复,一共发表过5篇顶会论文。

通讯作者为他的导师吕健勤(Chen Change Loy),南洋理工大学计算机学院副教授,商汤-南洋理工大学联合实验室S-Lab副主任。

他俩也是BasicVSR的原班作者。

BasicVSR++的剩余两位作者分别为:该校二年级博士生周尚辰和该校研究员Xu Xiangyu。

论文地址:
https://arxiv.org/abs/2104.13371

https://github.com/ckkelvinchan/RealBasicVSR

版权所有,未经授权不得以任何形式转载及使用,违者必究。

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK