试验设计在深度学习模型参数选择的应用
理学院
Application of Experimental Design in Parameter Selection for Deep Learning Models
本项目拟研究深度学习模型的参数选择问题。深度学习模型是大数据下人工智能的重要模型,主要包括较大规模、较多层数的各种神经网络,且主要以研究图像和自然语言为主流。深度学习模型中神经网络的设置,包括参数设置、神经网络层数设计、激活函数的选择等等一直由经验主导。绝大部分的深度学习相关论文都是在不断逼近人工智能的极限能力,只有少部分论文探讨神经网络的收敛条件和参数设定。随着计算机计算能力的飞速进步,神经网络的层数越来越多,带来了“神经网络层数越多,训练结果是不是越好“的讨论。而我们的目标是是提出一个有理论依据的深度学习模型的参数选择算法,从而在深度学习训练中对参数不断改进有指导作用。