2020年6月14日-6月19日,原定在美国西雅图召开的CVPR (Computer Vision and Pattern Recognition)会议以“云”会议方式顺利进行。CVPR是计算机视觉领域的世界三大顶级会议之一,也是该领域最具影响力的会议,该会议2020年的有效投稿数量6656篇,录用1470篇,投稿录用率仅为22%。我院杨梦龙老师团队的论文:“Wavelet Stereo: Learning Wavelet Coefficients of Disparity Map in Stereo Matching”(作者:杨梦龙,吴方瑞,李炜)被录用。
图1 理论框架
该论文将传统的小波变换方法与现代深度学习方法巧妙地融合在一起,提出了一种全新的双目立体匹配方法。该方法创造性地通过学习视差图的小波系数,并通过小波逆变换重建视差图的方式巧妙地将小波变换引入整个双目立体匹配的深度学习框架中。该论文提出的双目立体匹配算法在SceneFlow,KITTI2012和KITTI2015等公开数据集上都取得了非常不错的双目立体匹配效果,尤其在最大的公开数据集SceneFlow评测中取得了state-of-the-art的匹配效果。该论文将传统的计算机视觉方法,与现在的深度学习方法相结合,获得了评审专家的好评,认为该论文提出的对视差图进行小波分解的方法可能成为一种具有代表性的方法(The ACs see value in the proposed decomposition of disparity maps using the Haar wavelet basis, which may be a useful representation for capturing the multi-scale characteristics of disparity maps)。
图2 SceneFlow视差预测图,从左到右:输入,视差图和误差图
图3 KITTI2012视差预测图,从左到右:输入,视差图和误差图
图4 KITTI2015视差预测图,从左到右:输入,视差图和误差图