基于风格迁移的数据增强方法及其应用研究
北京市创新创业人才培养指导中心
Research on data augmentation method based on style transfer and its application
深度学习目前已广泛应用在图像分类、目标检测、语义分割等计算机视觉任务上。在实际应用场景中,由于实际图像与训练模型使用的图像在拍摄设备、环境条件、滤镜风格等方面有差异,常导致模型在实际场景中预测性能大幅下降。如果对实际图像重新标注并训练模型,则带来巨大的标注成本。传统的数据增强方法多基于事先设定好的规则,可以加强训练集图像的多样性,对模型的泛化性能提升有帮助。但这类方法未考虑面向实际图像有针对性地进行数据增强。而基于风格迁移技术将训练集图像的风格迁移至实际图像风格,保留标注标签不变,则会产生针对特定实际图像集合的风格接近的有标注结果的训练集,基于迁移后的数据集训练模型或对已有模型进行微调,将有助于提升模型在特定实际场景的预测性能。本项目研究基于风格迁移的数据增强方法,并通过实验评估其在图像分类、目标检测、语义分割等计算机视觉任务上对模型预测性能的提升效果。本项目研究成果在智能制造、智能交通、机器人等领域均具有重要的理论和应用价值。