基于深度强化学习的5G网络资源调度研究
信息与通信工程学院
Research on 5G Network resource scheduling based on deep reinforcement learning
5G网络的无线资源调度是影响网络性能的重要因素。现有的无线资源调度算法主要包括比例公平、轮询等,但是在面对时延敏感业务的调度时,都不能达到性能最优。由于无线资源分配问题本质上是一个Markov决策问题,因此,用DRL 算法设计无线调度第五代(5G)蜂窝网络的时延敏感的调度。因为调度策略是确定性的从通道和队列状态映射到调度操作,采用深度确定性策略梯度(Deep Deterministic Policy Gradient,DDPG)可对其进行优化。DDPG 收敛速度慢,服务质量,差性能低,并且5G网络环境一般是非平稳的,因此,基于DDPG的无线网络资源调度算法无法在真实的5G系统中实现。