Patent search ap:("北京邮电大学") AND inv:"牛海文" Page 1

1.

发明授权
基于深度强化学习的无线通信网络管控方法及相关设备有权

公开(公告)号：CN115333961B

公开(公告)日：2023-10-13

申请号：CN202210772369.9

申请日：2022-06-30

Applicant: 北京邮电大学

Inventor： 王鲁晗 , 牛海文 , 杜科良 , 路兆铭 , 温向明

IPC: H04L41/16 , H04L41/147 , H04L43/0852 , H04W24/04 , G06N3/08 , G06N3/044

Abstract: 本申请提供一种基于深度强化学习的无线通信网络管控方法及相关设备，该方法可以应用于包括智能化网元的无线通信网络管控，其中，该智能化网元可以包括状态‑动作‑奖励的强化学习架构，该方法能够根据不同控制器中的不同经验数据集将状态采集器获取的状态数据转化为增强状态数据，实现了延迟马尔可夫过程到标准马尔可夫过程的转化，避免了通信网络中状态和动作的时延对多个控制器中数据优化过程的影响，提高了控制器的优化效率。

2.

发明公开
基于深度强化学习的无线通信网络管控方法及相关设备有权

公开(公告)号：CN115333961A

公开(公告)日：2022-11-11

申请号：CN202210772369.9

申请日：2022-06-30

Applicant: 北京邮电大学

Inventor： 王鲁晗 , 牛海文 , 杜科良 , 路兆铭 , 温向明

IPC: H04L41/16 , H04L41/147 , H04L43/0852 , H04W24/04 , G06N7/00 , G06N3/08 , G06N3/04

Abstract: 本申请提供一种基于深度强化学习的无线通信网络管控方法及相关设备，该方法可以应用于包括智能化网元的无线通信网络管控，其中，该智能化网元可以包括状态‑动作‑奖励的强化学习架构，该方法能够根据不同控制器中的不同经验数据集将状态采集器获取的状态数据转化为增强状态数据，实现了延迟马尔可夫过程到标准马尔可夫过程的转化，避免了通信网络中状态和动作的时延对多个控制器中数据优化过程的影响，提高了控制器的优化效率。

Patent Agency Ranking