基于深度学习的交通安全信息的视觉识别子系统
国际学院
Visual identification subsystem based on in-depth study of traffic safety information
项目构思来历
随着物联网、人工智能等技术的蓬勃发展,智慧城市凭借着这些技术正快速的向前推进。而智慧交通作为其重要的组成部分,借助着信息技术的飞速发展,实现了交通安全信息的全方位共享和道路交通运行情况的监控和管理。其中,车牌识别、驾驶员人脸识别以及违章行为的识别和判定在交通安全管理和城市服务系统等方面充当着重要角色。
随着中国交通业的不断发展,出现了越来越多样化的道路环境的交通环境,与此相应的,交通安全信息的提取技术却相对滞后,面对多样化的交通环境,很多情况下的驾驶车辆信息及其交通安全信息都无法有效的提取。例如在一些交通情况多变、光照环境相对恶劣的条件下的交通安全信息的识别会出现较为严重的偏差,采用传统的特征提取方案提取交通安全信息图像的特征,获得的特征表达能力弱并且信息损失严重,对交通安全信息图像后续的处理具有不利的影响。
另一方面,2017年,在NLP领域出现的模型Transformer以及后续的改进对CNN产生了近乎“降维”的打击。自然语言领域的巨大突破激发了研究人员探索Transformer在计算机视觉领域的潜力和可行性。在此之前,卷积神经网络一直是图像分类处理的主力军。Swin Transformer和Vision Transformer在图像分类方面表现出强大的性能,它们诠释了Transformer在图像处理方面的巨大潜力。
项目意义
基于以上背景,本项目拟实现一个基于深度学习和Transformer的交通安全信息图像的图像分类、目标检测和语义分割模型,提升现有模型的精度和速度,追求实时性,使其可以完成对图像的高速高效的处理。其可以应用在各种简单与复杂的机动车道路交通场景,能够识别车牌、驾驶员信息以及判定是否违章。