基于生成式大模型的遥感图像语义分割技术研究
国际学院
Semantic Segmentation of Sensory Images Based on Generative Large Model and Transformer
本项目旨在利用最新的遥感图像处理技术(Transformer和SAM模型)进行遥感图像的土地覆盖分类。
遥感技术在土地覆盖分类中具有关键作用,而图像语义分割是实现这一目标的核心技术。传统的卷积神经网络(CNN)虽然在此领域取得了重大进展,但仍然面临挑战,如需要大量标记数据和复杂遥感图像等问题。在2017年,Transformer模型的引入在计算机视觉中掀起了一场革命,为图像分割任务带来了更强大的建模能力。2023年,Meta AI的SAM模型进一步推动了图像语义分割的发展。
SAM是一种零样本泛化的分割系统,无需额外训练即可处理各种图像。我们计划结合Transformer和SAM,借助大规模视觉语料库的通用图像分割模型,以提高遥感图像的土地覆盖分类准确性,同时解决传统方法面临的挑战。这将为环境监测、城市规划和农业管理等领域带来更准确和有效的遥感图像分析工具。