北京大学等提出SR新模块!通过Squeeze Reasoning实现高效的场景理解
涨点神器!本文提出Squeeze Reasoning新模块,由其建立的SRNet语义分割网络,表现SOTA!性能优于OCRNet、DANet等,还可应用于目标检测、全景分割等任务,代码即将开源!
Towards Efficient Scene Understanding via Squeeze Reasoning
作者单位:北京大学, 牛津大学, 深动科技, 商汤科技
论文:https://arxiv.org/abs/2011.03308
注:文末附图像分割学习交流群
基于图的卷积模型(例如non-local模块)已显示出可有效增强卷积神经网络(CNN)中的上下文建模能力。但是,其按像素计算的开销非常高,这使其不适用于高分辨率图像。
在本文中,我们探索了上下文图推理的效率,并提出了一种称为“Squeeze Reasoning”的新颖框架。首先,我们不是在空间图上传播信息,而是先学习将输入特征压缩为逐个通道的全局向量,并在单个向量内执行推理,从而可以显著降低计算成本。
具体来说,我们在向量中构建节点图,其中每个节点代表一个抽象的语义概念。同一语义类别内的精炼特征可以保持一致,因此对于下游任务很有用。我们表明,我们的方法可以模块化为端到端训练有素的模块,并且可以轻松插入现有网络。
主要由以下部分组成:
Node squeezing
Node graph reasoning
matrix
- Learned matrix
- Correlation matrix
Feature reconstruction
跟其它 non-local方法复杂度比较:
实验结果
尽管其简单性和轻巧性,我们的策略仍使我们能够建立一种新的语义分割技术,并在包括对象在内的各种其他场景理解任务上,相对于强大的,最先进的基准显示出显著的改进,如目标检测,实例分割和全景分割等任务。将提供代码以促进任何进一步的研究。
在语义分割上的性能表现:
在实时语义分割上的性能表现:
在目标检测、实例分割和全景分割上的性能表现:
CVer-图像分割交流群
建了CVer-图像分割微信交流群!想要进学习交流群的同学,可以直接加微信号:CVer5555。加的时候备注一下:图像分割+学校+昵称,即可。然后就可以拉你进群了。
强烈推荐大家关注CVer知乎账号和CVer微信公众号,可以快速了解到最新优质的CV论文。
推荐阅读
刷新WIDER Face纪录!TinaFace:人脸检测新网络,代码已开源!
这个AI能帮你女朋友自拍!从照片生成3D视频,总有个角度让她满意
STTR:基于Transformers的立体深度估计网络,代码已开源!
用GAN生成70岁的你!还可以重返17岁,代码已开源!ECCV 2020 Adobe等新研究
WACV2021 | 用于小目标检测的FPN中的高效融合因子
85.4 mIOU!NVIDIA:使用多尺度注意力进行语义分割
NeurIPS 2020 | Auto-Panoptic:用于全景分割的协作式多组件体系结构搜索
NeurIPS 20 | RelationNet++: Transformer桥接视觉表示的目标检测
利用YOLOv4和Deep SORT实现多摄像头实时目标跟踪和计数(已开源)
NeurIPS 20 | 超越EfficientNet!TinyNet:玩转网络的分辨率,深度和宽度
ECCV 2020 | 旷视开源LabelEnc:提升目标检测的新型中间监督方法
谷歌刚刚发布Objectron新数据集,可完美检测3D目标,超过4百万幅图像和15K视频剪辑!
综述 | MIT提出视频理解/行为识别:全面调研(2004-2020)
Recall Loss:用于不平衡图像分类和语义分割的召回损失
即插即用!Rotate to Attend:卷积Triplet注意力模块
ResNet还是DenseNet?即插即用的DS涨点神器来了!
TBC:共享Thinner Filters,实现更强的CNN!
超越EfficientNets!无需注意力,也能让你的网络更快更强!
OpenCV 4.5来了!更强的SIFT,改进RANSAC算法,新增目标跟踪网络SiamRPN++
NeurIPS 2020 | 谷歌大脑提出:重新思考预训练和自训练
NeurIPS 2020 | 用于图像复原/恢复的神经稀疏表示
NeurIPS 2020 | aLRPLoss:统一目标检测中的分类和定位的平衡损失函数
ECCV AIM 2020 真实图像超分辨率挑战赛3项冠军解决方案
LVIS 实例分割挑战赛2020的第一名解决方案:好的Box不能保证好的Mask
ETH Zurich提出DPIR:具有Denoiser先验的即插即用图像恢复
ECCV 2020 | NAS-DIP:通过NAS实现DIP(去噪/去雾/超分辨率/修复等)
ECCV 2020 | WeightNet:重新探索Weight网络的设计空间
ECCV 2020 | 53.5 AP!PAA:用于目标检测的IoU预测的概率Anchor分配
ECCV 2020 | 南京理工提出FPT:特征金字塔Transformer