基于diffusion model的图像风格转换
电子工程学院
Image style transfer based on diffusion model
散模型近年来在生成式任务中的应用日益广泛,特别是在图像生成领域展现出巨大的潜力。其工作原理是通过模拟一个多步噪声还原过程,逐步从随机噪声中生成高质量的图像。这种逐步反噪声的生成过程具有稳定的训练目标函数和易于扩展的优点,且可以覆盖目标分布的多样性。传统的生成对抗网络(GAN)虽然在图像生成的质量上占据优势,但训练困难且容易出现模式崩溃(即生成样本的多样性不足),这限制了其在大规模图像生成任务中的应用 。近年来的研究表明,通过改进扩散模型的网络结构和算法,能够有效提升图像生成的质量。例如,使用多级别的注意力机制以及适当的残差结构来增强图像特征的提取。此外,引入分类器指导的方法,通过对扩散过程中的每个生成步骤施加引导信息,可以在保持高精度的同时提高生成图像的类别一致性。这种方法被认为是扩散模型中提升样本真实度的有效手段,弥补了传统方法在多样性和精度上的局限性。