一种利用强化学习优化异构网络资源的方法

    公开(公告)号:CN112188600A

    公开(公告)日:2021-01-05

    申请号:CN202011002522.7

    申请日:2020-09-22

    Abstract: 本发明公开了一种利用强化学习优化异构网络资源的方法,属于通信技术领域,本发明集成强化学习和凸优化理论,提出根据动作的相关性,即ABS,CRE和小基站休眠策略,对动作空间进行分割,针对强化学习建模过程中系统能效作为奖励函数值数量级过大问题,重新设计奖励函数值先取负数再取倒数,作为新的奖励函数值。本发明减小强化学习的动作空间,凸优化理论可以保证系统收敛性,同时加快强化学习的收敛速度;通过仿真实验可以证明该方法具有收敛性,更低的复杂度,在几乎达到系统能效理论值的前提下,与传统表格类型的Q‑Learning相比,收敛速度提升60%。

Patent Agency Ranking