遥感目标检测数据集及竞赛
【数据集】
- DOTA-v1.0: A Large-scale Dataset for Object Detection in Aerial Images, [数据集地址]. 武大遥感国重实验室-夏桂松和华科电信学院-白翔等合作做的一个航拍图像数据集,目前最大的光学遥感图像数据集 (图像来源 GoogleEarth 和两颗中国的卫星 GF-2,JL-1)。该数据集共包含2806张遥感图像(图片尺寸从 800*800 到 4000*4000),一共188,282个实例,分为15个类别:飞机、船只、储蓄罐、棒球内场、网球场、篮球场、田径场、海港、桥、大型车辆、小型车辆、直升飞机、英式足球场、环形路线、游泳池。每个实例都由一个四边形边界框标注,顶点按顺时针顺序排列。官方使用1/2的图像作为训练集,1/6作为验证集,1/3作为测试集。测试集没有公开,需要上传至服务器。
- DOTA-v1.5: 该数据集即为 CVPR2019 Challenge on Object Detection in Aerial Images, [数据集地址]. 一共40万个实例,分为16个类别(相比 DOTA-v1.0 添加了集装箱起重机这个类别)。图像和 DOTA-v1.0完全相同,2806张。补全了许多在 DOTA-v1.0 中丢失的大约10像素以下的实例标注。
- DIOR: Object Detection in Optical Remote Sensing Images: A Survey and A New Benchmark, 西北工业大学, [数据集地址]. 含23463张图片和190288实例,覆盖20种目标,比DOTA数据集更大!2019年9月开始挂在arXiv上面。
- RSOD: 武汉大学, [数据集地址]. 含 976张图片 (Google Earth and Tianditu) 和6950个实例,空间分辨率从 0.3m 到 3m。 包含飞机、操场、立交桥、油桶四类目标,数目分别为:4993 架飞机,191 个操场,180 座立交桥,1586 个油桶该数据集于 2015 年由发布。
- HRSC2016: 西北工业大学, [数据集地址]. 用于舰船检测,含1070张图片 (Google Earth) 和2976个实例,使用旋转框标注。
- DLR 3K Vehicle: 用于车辆检测,包含20张5616*3744的图片, 空间分辨率为13cm,14235个实例。在德国慕尼黑1000米的空中使用DLR 3K 摄像机 (一种近乎实时的机载数字监控系统) 拍摄的汽车,使用旋转框标注。
- UCAS‐AOD: 中科大, [数据集地址]. 用于飞机和车辆检测,飞机数据集由600张3210架飞机的图像组成,而车辆数据集由310张2819架车辆的图像组成。所有的图像都经过精心选择,使数据集中的目标方向分布均匀。
- VEDAI: [数据集地址], VEDAI数据集用于航空图像中的多类车辆检测。它包含3640个车辆实例,包括9个类别,包括船、车、露营车、飞机、接送车、拖拉机、卡车、货车和其他类别。该数据集共包含来自 犹他州AGRC 的1210张1024×1024的航空图像,空间分辨率12.5 cm。数据集中的图像采集于2012年春季,每张图像都有四个未压缩的彩色通道,包括三个RGB彩色通道和一个近红外通道。
- NWPU VHR‐10: 西北工业大学, [数据集地址]. 含10个地理空间对象类,包括飞机、棒球场、篮球场、桥梁、港口、地面田径场、船舶、储罐、网球场和车辆。它由715幅RGB图像和85幅锐化彩色红外图像组成。其中715幅RGB图像采集自谷歌地球,空间分辨率从0.5m到2m不等。85幅经过pan‐锐化的红外图像,空间分辨率为0.08m,来自Vaihingen数据。该数据集共包含3775个对象实例,其中包括757架飞机、390个棒球方块、159个篮球场、124座桥梁、224个港口、163个田径场、302艘船、655个储罐、524个网球场和477辆汽车,这些对象实例都是用水平边框手工标注的。
- COWC: [数据集地址]. 包含53张图片,32716个车辆实例,旋转框标注。
- SZTAKI‐INRIA: 用于对各种建筑检测方法进行基准测试。它由665栋建筑组成,手工标注了定向边界框,分布在来自曼彻斯特(英国)、萨达和布达佩斯(匈牙利)、科达·阿苏尔和诺曼底(法国)以及博登西(德国)的9幅遥感图像中。所有的图像只包含红色(R)、绿色(G)和蓝色(B)三个通道。其中,两幅图像(Szada和Budapest)是航空图像,其余七幅图像是来自QuickBird、IKONOS和谷歌Earth的卫星图像。
- TAS: 用于航空图像中的汽车检测。它总共包含30张图片和1319辆带有任意方向手动标注的汽车。这些图像的空间分辨率相对较低,由建筑物和树木造成的阴影较多。
【竞赛】
DOTA
旋转框:
- 第一名:武汉大学 dingjian [CVPR2019论文], Faster R-CNN OBB + RoI Transformer
- 第二名:南京理工大学 pca_lab, Improved Cascade R2CNN
- 第三名:中科院空天信息研究所 赛博智能
- 第四名:中科院电子所 NIST-czh,
水平框:
- 第一名:武汉大学 dingjian [CVPR2019论文], Faster R-CNN OBB + RoI Transformer
- 第二名:南京理工大学 pca_lab, Improved Cascade R2CNN
- 第三名:清华大学 geo
- 第四名:国科大 yangxue
CVPR2019 Challenge on Object Detection in Aerial Images
- 主页
- 数据集:即 DOTA-v1.5,一共40万个实例,分为16个类别(相比 DOTA-v1.0 添加了集装箱起重机这个类别)。图像和 DOTA-v1.0完全相同,2806张。补全了许多在 DOTA-v1.0 中丢失的大约10像素以下的实例标注。
- 评价指标:mAP,分为旋转框和水平框两个赛道
旋转框:
- 第一名:中国科学技术大学 USTC-NELSLIP [arxiv]
- 第二名:南京理工大学 pca_lab
- 第三名:中科院电子所 NIST-czh
- 第四名:中科院空天信息研究所 赛博智能
水平框:
- 第一名:南京理工大学 pca_lab
- 第二名:中国科学技术大学 USTC-NELSLIP
- 第三名:中科院空天信息研究所 AICyber
- 第四名:西电&华为云 wonderwall
遥感图像稀疏表征与智能分析竞赛
- 中科院电子所 NIST-czh
- 中科院空天信息研究所 赛博智能
- 北京邮电大学 BUPT_CAD
- 电子科技大学 IVIPC-DET
近几年学术论文调研汇总
2020
2019:
- R3Det: Refined Single-Stage Detector with Feature Refinement for Rotating Object,【上海交通大学】,一阶段旋转框:RetinaNet+FRM(类似于roiAlign)
- SCRDet: Towards More Robust Detection for Small, Cluttered and Rotated Objects,【国科大】
- Learning RoI Transformer for Detecting Oriented Objects in Aerial Images. 【武汉大学】,
- X-LineNet: Detecting Aircraft in Remote Sensing Images by a pair of Intersecting Line Segments【国科大&中科院】,通过一对相交线检测遥感图像中的飞机
- Adaptive Period Embedding for Representing Oriented Objects in Aerial Images【中国科学技术大学】, 提出了 Adaptive Period Embedding (APE) 和 Length Independent IoU (LIIoU)
- A Novel Data Augmentation Method for Detection of Specific Aircraft in Remote Sensing RGB Images. 【哈尔滨工程大学】,将真实的遥感图像与特定的飞机三维模型相结合,以形成模拟图像
- A 2 RMNet : Adaptively Aspect Ratio Multi-Scale Network for Object Detection in Remote Sensing Images. 【电子科技大学】,一种端到端自适应长宽比多尺度网络(A2RMNet)
- An Efficient Method of Detection and Recognition in Remote Sensing Image Based on multi-angle Region of Interests. 【北航&国科大】,旋转RoI,猜测用于占坑,没有写具体方法,已经弃坑
- Automatic Detection of Track and Fields in China from High-Resolution Satellite Images Using Multi-Scale-Fused Single Shot MultiBox Detector, 【国科大】,改良SSD,加入 deconvolution 和 concat
- CAD-Net: A Context-Aware Detection Network for Objects in Remote Sensing Imagery. 【南洋理工大学】
2018:
- You Only Look Twice: Rapid Multi-Scale Object Detection In Satellite Imagery【CosmiQWorks,In-Q-Tel】
编辑于 2020-08-22 15:24