北京大学等提出SR新模块！通过Squeeze Reasoning实现高效的场景理解

涨点神器！本文提出Squeeze Reasoning新模块，由其建立的SRNet语义分割网络，表现SOTA！性能优于OCRNet、DANet等，还可应用于目标检测、全景分割等任务，代码即将开源！

Towards Efficient Scene Understanding via Squeeze Reasoning

作者单位：北京大学, 牛津大学, 深动科技, 商汤科技
论文：https://arxiv.org/abs/2011.03308

注：文末附图像分割学习交流群

基于图的卷积模型（例如non-local模块）已显示出可有效增强卷积神经网络（CNN）中的上下文建模能力。但是，其按像素计算的开销非常高，这使其不适用于高分辨率图像。

在本文中，我们探索了上下文图推理的效率，并提出了一种称为“Squeeze Reasoning”的新颖框架。首先，我们不是在空间图上传播信息，而是先学习将输入特征压缩为逐个通道的全局向量，并在单个向量内执行推理，从而可以显著降低计算成本。

具体来说，我们在向量中构建节点图，其中每个节点代表一个抽象的语义概念。同一语义类别内的精炼特征可以保持一致，因此对于下游任务很有用。我们表明，我们的方法可以模块化为端到端训练有素的模块，并且可以轻松插入现有网络。

主要由以下部分组成：

Node squeezing

Node graph reasoning

matrix

Learned matrix
Correlation matrix

Feature reconstruction

跟其它 non-local方法复杂度比较：

实验结果

尽管其简单性和轻巧性，我们的策略仍使我们能够建立一种新的语义分割技术，并在包括对象在内的各种其他场景理解任务上，相对于强大的，最先进的基准显示出显著的改进，如目标检测，实例分割和全景分割等任务。将提供代码以促进任何进一步的研究。

在语义分割上的性能表现：

在实时语义分割上的性能表现：

在目标检测、实例分割和全景分割上的性能表现：

CVer-图像分割交流群

建了CVer-图像分割微信交流群！想要进学习交流群的同学，可以直接加微信号：CVer5555。加的时候备注一下：图像分割+学校+昵称，即可。然后就可以拉你进群了。

强烈推荐大家关注CVer知乎账号和CVer微信公众号，可以快速了解到最新优质的CV论文。

推荐阅读

冠军解决方案！用于脑肿瘤分割的nnU-Net改进

刷新WIDER Face纪录！TinaFace：人脸检测新网络，代码已开源！

这个AI能帮你女朋友自拍！从照片生成3D视频，总有个角度让她满意

STTR：基于Transformers的立体深度估计网络，代码已开源！

用GAN生成70岁的你！还可以重返17岁，代码已开源！ECCV 2020 Adobe等新研究

WACV2021 | 用于小目标检测的FPN中的高效融合因子

综述 | 对比自监督学习技术：全面调研

85.4 mIOU！NVIDIA：使用多尺度注意力进行语义分割

深入研究Label Smoothing(标签平滑)

使用PyTorch时，最常见的4个错误

NeurIPS 2020 | Auto-Panoptic：用于全景分割的协作式多组件体系结构搜索

NeurIPS 20 | RelationNet++: Transformer桥接视觉表示的目标检测

利用YOLOv4和Deep SORT实现多摄像头实时目标跟踪和计数（已开源）

NeurIPS 20 | 超越EfficientNet！TinyNet：玩转网络的分辨率，深度和宽度

涨点技巧！汇集13个Kaggle图像分类项目的性能提升指南

利用知识蒸馏改进目标检测：面向准确高效的检测器

使用深度学习从视频中估计车辆的速度（已开源）

ECCV 2020 | 旷视开源LabelEnc：提升目标检测的新型中间监督方法

这9个技巧让你的PyTorch模型训练得飞快！

牛津博士论文 | 学习重建和分割3D目标（143页PDF）

谷歌刚刚发布Objectron新数据集，可完美检测3D目标，超过4百万幅图像和15K视频剪辑！

综述 | MIT提出视频理解/行为识别：全面调研（2004-2020）

综述 | 基于无人机的目标跟踪的相关滤波器：全面调研

从三个维度加速你的CNN：全面的剪枝框架

Recall Loss：用于不平衡图像分类和语义分割的召回损失

即插即用！Rotate to Attend：卷积Triplet注意力模块

旷视提出MegDetV2：目标检测/实例分割系统

综述 | 基于深度学习的医学图像分割技术：全面调研

ResNet还是DenseNet？即插即用的DS涨点神器来了！

综述 | 基于深度学习的端到端人脸识别技术：全面调研

TBC：共享Thinner Filters，实现更强的CNN！

综述 | 行人检测技术（从手工特征到深度学习）：全面调研

超越EfficientNets！无需注意力，也能让你的网络更快更强！

OpenCV 4.5来了！更强的SIFT，改进RANSAC算法，新增目标跟踪网络SiamRPN++

综述 | 基于深度学习的实时语义分割方法：全面调研

涨点神器！南航提出AFF：注意力特征融合

NeurIPS 2020 | 谷歌大脑提出：重新思考预训练和自训练

NeurIPS 2020 | 用于图像复原/恢复的神经稀疏表示

NeurIPS 2020 | aLRPLoss：统一目标检测中的分类和定位的平衡损失函数

CCE：具有互补交叉熵的不平衡图像分类

谷歌地标检索2020 Kaggle 第一名解决方案

ECCV AIM 2020 真实图像超分辨率挑战赛3项冠军解决方案

LVIS 实例分割挑战赛2020的第一名解决方案：好的Box不能保证好的Mask

ETH Zurich提出DPIR：具有Denoiser先验的即插即用图像恢复

ECCV 2020 | NAS-DIP：通过NAS实现DIP（去噪/去雾/超分辨率/修复等）

综述 | 小样本学习：全面调研（Few-shot）

使用深度神经网络从Noisy Labels中学习：全面调研

剪枝filter？还是剪枝layer？这是个问题

ECCV 2020 | WeightNet：重新探索Weight网络的设计空间

ECCV 2020 | 53.5 AP！PAA：用于目标检测的IoU预测的概率Anchor分配

ECCV 2020 | 南京理工提出FPT：特征金字塔Transformer

ECCV 2020 | BMask R-CNN：边界保持的Mask R-CNN

ECCV 2020 | 即插即用！PSConv：将特征金字塔压缩到紧凑

编辑于 2020-12-02 23:43

目标检测

卷积神经网络（CNN）

图像分割

北京大学等提出SR新模块！通过Squeeze Reasoning实现高效的场景理解

实验结果

CVer-图像分割交流群

推荐阅读

文章被以下专栏收录

CVer计算机视觉