北京大学等提出SR新模块!通过Squeeze Reasoning实现高效的场景理解

北京大学等提出SR新模块!通过Squeeze Reasoning实现高效的场景理解

涨点神器!本文提出Squeeze Reasoning新模块,由其建立的SRNet语义分割网络,表现SOTA!性能优于OCRNet、DANet等,还可应用于目标检测、全景分割等任务,代码即将开源!

Towards Efficient Scene Understanding via Squeeze Reasoning

作者单位:北京大学, 牛津大学, 深动科技, 商汤科技
论文:arxiv.org/abs/2011.0330

注:文末附图像分割学习交流群

基于图的卷积模型(例如non-local模块)已显示出可有效增强卷积神经网络(CNN)中的上下文建模能力。但是,其按像素计算的开销非常高,这使其不适用于高分辨率图像。

在本文中,我们探索了上下文图推理的效率,并提出了一种称为“Squeeze Reasoning”的新颖框架。首先,我们不是在空间图上传播信息,而是先学习将输入特征压缩为逐个通道的全局向量,并在单个向量内执行推理,从而可以显著降低计算成本。

具体来说,我们在向量中构建节点图,其中每个节点代表一个抽象的语义概念。同一语义类别内的精炼特征可以保持一致,因此对于下游任务很有用。我们表明,我们的方法可以模块化为端到端训练有素的模块,并且可以轻松插入现有网络。

主要由以下部分组成:

Node squeezing

Node graph reasoning

matrix

  • Learned matrix
  • Correlation matrix

Feature reconstruction

跟其它 non-local方法复杂度比较:

实验结果

尽管其简单性和轻巧性,我们的策略仍使我们能够建立一种新的语义分割技术,并在包括对象在内的各种其他场景理解任务上,相对于强大的,最先进的基准显示出显著的改进,如目标检测,实例分割和全景分割等任务。将提供代码以促进任何进一步的研究。

在语义分割上的性能表现:

在实时语义分割上的性能表现:

在目标检测、实例分割和全景分割上的性能表现:

CVer-图像分割交流群

建了CVer-图像分割微信交流群!想要进学习交流群的同学,可以直接加微信号:CVer5555。加的时候备注一下:图像分割+学校+昵称,即可。然后就可以拉你进群了。

强烈推荐大家关注CVer知乎账号和CVer微信公众号,可以快速了解到最新优质的CV论文。

推荐阅读

冠军解决方案!用于脑肿瘤分割的nnU-Net改进

刷新WIDER Face纪录!TinaFace:人脸检测新网络,代码已开源!

这个AI能帮你女朋友自拍!从照片生成3D视频,总有个角度让她满意

STTR:基于Transformers的立体深度估计网络,代码已开源!

用GAN生成70岁的你!还可以重返17岁,代码已开源!ECCV 2020 Adobe等新研究

WACV2021 | 用于小目标检测的FPN中的高效融合因子

综述 | 对比自监督学习技术:全面调研

85.4 mIOU!NVIDIA:使用多尺度注意力进行语义分割

深入研究Label Smoothing(标签平滑)

使用PyTorch时,最常见的4个错误

NeurIPS 2020 | Auto-Panoptic:用于全景分割的协作式多组件体系结构搜索

NeurIPS 20 | RelationNet++: Transformer桥接视觉表示的目标检测

利用YOLOv4和Deep SORT实现多摄像头实时目标跟踪和计数(已开源)

NeurIPS 20 | 超越EfficientNet!TinyNet:玩转网络的分辨率,深度和宽度

涨点技巧!汇集13个Kaggle图像分类项目的性能提升指南

利用知识蒸馏改进目标检测:面向准确高效的检测器

使用深度学习从视频中估计车辆的速度(已开源)

ECCV 2020 | 旷视开源LabelEnc:提升目标检测的新型中间监督方法

这9个技巧让你的PyTorch模型训练得飞快!

牛津博士论文 | 学习重建和分割3D目标(143页PDF)

谷歌刚刚发布Objectron新数据集,可完美检测3D目标,超过4百万幅图像和15K视频剪辑!

综述 | MIT提出视频理解/行为识别:全面调研(2004-2020)

综述 | 基于无人机的目标跟踪的相关滤波器:全面调研

从三个维度加速你的CNN:全面的剪枝框架

Recall Loss:用于不平衡图像分类和语义分割的召回损失

即插即用!Rotate to Attend:卷积Triplet注意力模块

旷视提出MegDetV2:目标检测/实例分割系统

综述 | 基于深度学习的医学图像分割技术:全面调研

ResNet还是DenseNet?即插即用的DS涨点神器来了!

综述 | 基于深度学习的端到端人脸识别技术:全面调研

TBC:共享Thinner Filters,实现更强的CNN!

综述 | 行人检测技术(从手工特征到深度学习):全面调研

超越EfficientNets!无需注意力,也能让你的网络更快更强!

OpenCV 4.5来了!更强的SIFT,改进RANSAC算法,新增目标跟踪网络SiamRPN++

综述 | 基于深度学习的实时语义分割方法:全面调研

涨点神器!南航提出AFF:注意力特征融合

NeurIPS 2020 | 谷歌大脑提出:重新思考预训练和自训练

NeurIPS 2020 | 用于图像复原/恢复的神经稀疏表示

NeurIPS 2020 | aLRPLoss:统一目标检测中的分类和定位的平衡损失函数

CCE:具有互补交叉熵的不平衡图像分类

谷歌地标检索2020 Kaggle 第一名解决方案

ECCV AIM 2020 真实图像超分辨率挑战赛3项冠军解决方案

LVIS 实例分割挑战赛2020的第一名解决方案:好的Box不能保证好的Mask

ETH Zurich提出DPIR:具有Denoiser先验的即插即用图像恢复

ECCV 2020 | NAS-DIP:通过NAS实现DIP(去噪/去雾/超分辨率/修复等)

综述 | 小样本学习:全面调研(Few-shot)

使用深度神经网络从Noisy Labels中学习:全面调研

剪枝filter?还是剪枝layer?这是个问题

ECCV 2020 | WeightNet:重新探索Weight网络的设计空间

ECCV 2020 | 53.5 AP!PAA:用于目标检测的IoU预测的概率Anchor分配

ECCV 2020 | 南京理工提出FPT:特征金字塔Transformer

ECCV 2020 | BMask R-CNN:边界保持的Mask R-CNN

ECCV 2020 | 即插即用!PSConv:将特征金字塔压缩到紧凑

编辑于 2020-12-02 23:43