遥感图像“深度”解译
国际学院
Deep interpretation of remote sensing images
遥感技术是军事侦察、导弹预警、军事测绘、海洋监视与气象观测等领域的重要研究课题之一,其中通过遥感图像对地面进行探测与侦查具有巨大的研究价值。遥感图像的目标检测和语义分割都是遥感图像应用的核心技术,例如遥感图像中飞机的目标检测对军事侦查有着重要的研究价值,道路遥感图像的语义分割也有利于自动化地提取道路特征,节省传统遥感图像目视解译所需的大量人力物力。
随着遥感技术的不停发展,遥感图像的质量不断提升,与此相应地,遥感图像信息提取技术的发展却相对滞后,海量的高分辨率遥感图像无法得到充分的利用。遥感图像的细节信息丰富、特征维度高,采用传统的特征提取方案提取遥感图像的特征,获得的特征表达能力弱并且信息损失严重,对遥感图像后续的处理具有不利的影响。
另一方面,2017年,在NLP领域出现的模型Transformer以及后续的改进对CNN产生了近乎“降维”的打击。自然语言领域的巨大突破激发了研究人员探索Transformer在计算机视觉领域的潜力和可行性。在此之前,卷积神经网络一直是图像分类处理的主力军。Swin Transformer和Vision Transformer在图像分类方面表现出强大的性能,它们诠释了Transformer在图像处理方面的巨大潜力。
基于以上背景,本项目拟实现一个基于深度学习和Transformer的遥感图像目标检测和语义分割模型,提升现有模型的精度和速度,追求实时性,使其可以完成对图像的高速高效的处理;同时基于模型大小的考量,实现模型的轻度化,使其可以实现在移动平台上的搭载。