13

遥感图像中的小物体检测(内有新数据集)

 3 years ago
source link: https://mp.weixin.qq.com/s/DR-rFphu-19QiFtTdGPPbw
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

遥感图像中的小物体检测(内有新数据集)

夏初 3D视觉工坊 1/24

点击上方“3D视觉工坊”,选择“星标”

干货第一时间送达

640?wx_fmt=jpeg

文章:Small-Object Detection in Remote Sensing Images with End-to-End Edge-Enhanced GAN and Object Detector Network摘要:与大物体相比,遥感图像中的小物体检测性能并不理想,尤其是在低分辨率和嘈杂的图像中。一种基于生成对抗网络(GAN)的模型,称为增强超分辨率GAN(ESRGAN),具有出色的图像增强性能,但是重建的图像通常会丢失高频边缘信息。因此,物体检测性能在恢复的噪点和低分辨率遥感影像上显示出小目标物体的退化。受边缘增强GAN(EEGAN)和ESRGAN成功的启发,本研究使用了一种新型的边缘增强超分辨率GAN(EESRGAN)来改善遥感图像的质量,并以端到端的方式使用了不同的探测器网络,将检测器损耗反向传播到EESRGAN中,以提高检测性能。研究人员提出了一种包含三个组件的体系结构:ESRGAN,EEN (边缘增强网络)和检测网络。对于ESRGAN和EEN,使用了RRDB(残差密集块),对于检测器网络,我们使用了更快的基于区域的FRCNN(两阶段检测器)和SSD(一级检测器)。在相关数据集上进行的大量实验表明,该方法具有出色的性能。研究背景及问题:遥感图像目标检测在环境监管、监视、军事、国家安全、交通、林业、油气活动监测等领域具有广泛的应用前景,然而,目前的目标检测技术对于包含噪声和低分辨率的遥感图像而言,尤其是对于图像中的小目标,其检测效果并不理想,即使在高分辨率图像上,对小目标的检测性能也远低于对大目标的检测性能。其次,大面积高分辨率影像的成本较大,许多组织正在使用高分辨率的卫星图像来实现其目的,例如当出于监管或交通目的连续监视大区域时,频繁购买高分辨率图像的成本很高,这对于一个经常更新的大区域来说是非常昂贵的。因此,需要一种解决方案来提高低分辨率图像中较小目标的检测精度。研究贡献:研究人员提出的体系结构由两部分组成:EESRGAN网络和检测器网络。该方法受到EEGAN和ESRGAN网络的启发,研究人员采用了一个生成子网络、一个鉴别子网络和一个边缘增强子网络作为SR(超分辨率)网络。对于生成器和边缘增强网络,研究人员使用RRDB。这些块包含多层的、连接密集的残差网络,具有良好的图像增强性能。研究中使用相对论鉴别器而不是普通鉴别器。除了GAN损失和鉴别器的损失外,还将Charbonnier损失用于边缘增强网络。最后,使用了不同的检测器从SR图像中检测出小的物体。当将检测损失反向传播到SR网络中时,检测器的作用就像鉴别器,因此提高了SR图像的质量。数据集:研究人员根据卫星图像(Bing地图)创建了OGST(油气储罐)数据集,该数据集的GSD为30 cm和1.2 m。数据集包含来自加拿大阿尔伯塔省的带标签的油气储罐,研究人员在SR图像上检测到了这些储罐。储罐的检测和计数对于阿尔伯塔省能源监管机构至关重要,以确保安全,高效,有序和环保负责任地开发能源。除了OGST数据集外,研究人员还将方法应用于COWC数据集(Cars Overhead with Context),以比较不同用例的检测性能。对于两个数据集,该方法均优于独立的最新研究结果。研究过程:本文旨在提高遥感图像上小目标的检测性能,作者提出了一种端到端网络结构,其由两个模块组成:基于GAN的SR网络和检测网络,整个网络以端到端的方式进行训练。其中,基于GAN的SR网络有三个组成部分:生成器、鉴别器和EEN。该方法利用端到端训练,将检测损失的梯度从检测板反向传播到生成器中,因此,检测器也像鉴别器一样工作,促使发生器产生与地面真实相似的真实图像。整个网络结构可以分为两部分:由EEN构成的生成器,由DRa和检测器网络构成的鉴别器。
640?wx_fmt=png
生成器G生成中间超分辨率(ISR)图像,然后在应用EEN网络之后生成最终SR图像。鉴别器区分HR图像和ISR。DRa的倒置梯度反向传播到生成器中,以创建SR图像,从而实现精确的对象检测。边缘信息是从ISR中提取的,而EEN网络会增强这些边缘。然后,将增强的边缘再次添加到ISR减去拉普拉斯算子提取的原始边缘,将得到具有增强边缘的输出SR图像。最后,研究人员使用探测器网络从SR图像中探测物体。研究中对EEN使用两个不同的损失函数:一个比较SR和地面真实图像之间的差异,另一个比较从ISR和地面真实中提取的边缘之间的差异。研究人员还使用VGG19网络进行特征提取,以用于感知损失。因此,可以生成具有更精确边缘信息的更逼真的图像。
640?wx_fmt=png
640?wx_fmt=png
边缘增强网络研究结果:本研究首先进行模型单独训练,通过训练SR网络直到收敛,然后基于SR图像训练检测器网络。再进行端到端训练,也采用了单独的训练作为训练前的初始化权重步骤,然后联合训练SR和目标检测网络,将来自目标检测器的梯度值传递到生成器网络中。在训练过程中,学习率被设置为0.0001,每50 K迭代减半,批次大小设置为5,使用Adam[1]作为优化器,β1 = 0.9,β2 = 0.999,并更新整个架构的权值直到收敛,然后为生成器创建23个残差密集块,为EEN网络创建5个RRDB块。在COWC  数据集的训练过程中,端到端模型训练历时96小时,共200个批次,在测试过程中,使用快速基于区域卷积神经网络的平均推理耗时大约是0.25秒,SSD (Single-Shot MultiBox Detector) 是0.14秒。通过该模型进行小目标检测过程如下图所示。
640?wx_fmt=png
640?wx_fmt=png
总结:本文提出了一种以低分辨率 (Low-Resolution, LR) 卫星图像为输入,以目标检测结果为输出的端到端检测模型。该模型包含SR网络和检测器网络,使用SR系统和检测器的不同组合来比较使用两个不同数据集进行检测的平均精确度 (Average Precision, AP), 实验结果表明,本文所提出的基于快速R-CNN模型的SR网络对卫星图像上的小目标识别具有较好的检测效果。然而,本文还需要在OGST (Oil and Gas Storage Tank) 数据集中添加更多样化的训练数据,以使分类模型在检测油气储罐方面具有更好的鲁棒性。同时还需要探索不同的数据集和技术,以创造更真实的LR图像。总之,本文提出的方法结合了不同的策略,为LR图像上的小目标检测任务提供了更好的解决方案。备注:作者也是我们「3D视觉从入门到精通」特邀嘉宾:一个超干货的3D视觉学习社区本文仅做学术分享,如有侵权,请联系删文。下载1在「3D视觉工坊」公众号后台回复:3D视觉即可下载 3D视觉相关资料干货,涉及相机标定、三维重建、立体视觉、SLAM、深度学习、点云后处理、多视图几何等方向。下载2在「3D视觉工坊」公众号后台回复:3D视觉github资源汇总即可下载包括结构光、标定源码、缺陷检测源码、深度估计与深度补全源码、点云处理相关源码、立体匹配源码、单目、双目3D检测、基于点云的3D检测、6D姿态估计源码汇总等。下载3在「3D视觉工坊」公众号后台回复:相机标定即可下载独家相机标定学习课件与视频网址;后台回复:立体匹配即可下载独家立体匹配学习课件与视频网址。

重磅!3DCVer-学术论文写作投稿 交流群已成立

扫码添加小助手微信,可申请加入3D视觉工坊-学术论文写作与投稿 微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。

同时也可申请加入我们的细分方向交流群,目前主要有3D视觉CV&深度学习SLAM三维重建点云后处理自动驾驶、多传感器融合、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流、ORB-SLAM系列源码交流、深度估计等微信群。

一定要备注:研究方向+学校/公司+昵称,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,可快速被通过且邀请进群。原创投稿也请联系。

640?wx_fmt=png▲长按加微信群或投稿

640?wx_fmt=jpeg

▲长按关注公众号

3D视觉从入门到精通知识星球:针对3D视觉领域的知识点汇总、入门进阶学习路线、最新paper分享、疑问解答四个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的铁杆粉丝聚集区,近2000星球成员为创造更好的AI世界共同进步,知识星球入口:

学习3D视觉核心技术,扫描查看介绍,3天内无条件退款640?wx_fmt=jpeg 圈里有高质量教程资料、可答疑解惑、助你高效解决问题觉得有用,麻烦给个赞和在看~640?wx_fmt=gif


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK