-
公开(公告)号:CN116456416A
公开(公告)日:2023-07-18
申请号:CN202310509256.4
申请日:2023-05-08
Applicant: 东南大学
Abstract: 本发明结合强化学习探索与双Q学习思想,公开了一种基于地理位置的离线双Q学习路由方法,包括如下步骤:信标交互与奖励表的计算,经验获取与Q值表的更新,邻居最大Q值的同步及路由决策。在强化学习算法中将数据包映射为智能体,智能体获取的奖励值综合考虑了链路质量、节点度、路由空洞与欧氏距离因素,通过合理的奖励与惩罚机制,智能体可以感知路由空洞并使数据包避免转发到空洞节点。通过双Q学习的方法避免了Q值过估计的问题,使Q值表更快地收敛到最优路径。本发明实现了在高动态网络环境中避免路由空洞,实时寻找全局最优的路由,有效提高了网络的服务质量,提高了数据包传递的成功率,降低了传输端到端时延。