遥感图像实时语义分割算法研究
国际学院
Research on Real-time Semantic Segmentation Algorithms for Remote Sensing Images
遥感图像有着高分辨率影像数据少,场景复杂等特点,这使得传统方法难以取得足够高的精度。自深度学习的方法引入遥感图像语义分割领域后,研究人员能够提取到更为抽象的特征,提高了对复杂场景的解析能力,很大程度上提高了遥感图像语义分割的精度。随后以FCN、U-Net、DeepLab为代表的全卷积网络的出现更是让精度达到了新的高度。之后,Transformer的出现使得情况发生了改变,革新性的Attention结构使得Transformer成为了CNN网络的“上位替代”。在经过一定的研究后,Transformer被引入CV领域,其各方面性能都令人满意和期待。但自CNN时代以来,常用的普通语义分割网络就存在着难以兼具“算得快”和“算得准”两点。而遥感图像往往有着相较普通图像更高的分辨率、通道数和信息量,使得训练时间过长,预测时间无法满足智慧城市、智慧交通等新兴应用对于实时性的需求。本项目的主要内容就是研究最新的实时语义分割算法,尝试将其引用到遥感图像语义分割领域,得到高精、高效算法。