-
公开(公告)号:CN115333961B
公开(公告)日:2023-10-13
申请号:CN202210772369.9
申请日:2022-06-30
Applicant: 北京邮电大学
IPC: H04L41/16 , H04L41/147 , H04L43/0852 , H04W24/04 , G06N3/08 , G06N3/044
Abstract: 本申请提供一种基于深度强化学习的无线通信网络管控方法及相关设备,该方法可以应用于包括智能化网元的无线通信网络管控,其中,该智能化网元可以包括状态‑动作‑奖励的强化学习架构,该方法能够根据不同控制器中的不同经验数据集将状态采集器获取的状态数据转化为增强状态数据,实现了延迟马尔可夫过程到标准马尔可夫过程的转化,避免了通信网络中状态和动作的时延对多个控制器中数据优化过程的影响,提高了控制器的优化效率。
-
公开(公告)号:CN115333961A
公开(公告)日:2022-11-11
申请号:CN202210772369.9
申请日:2022-06-30
Applicant: 北京邮电大学
IPC: H04L41/16 , H04L41/147 , H04L43/0852 , H04W24/04 , G06N7/00 , G06N3/08 , G06N3/04
Abstract: 本申请提供一种基于深度强化学习的无线通信网络管控方法及相关设备,该方法可以应用于包括智能化网元的无线通信网络管控,其中,该智能化网元可以包括状态‑动作‑奖励的强化学习架构,该方法能够根据不同控制器中的不同经验数据集将状态采集器获取的状态数据转化为增强状态数据,实现了延迟马尔可夫过程到标准马尔可夫过程的转化,避免了通信网络中状态和动作的时延对多个控制器中数据优化过程的影响,提高了控制器的优化效率。
-