-
公开(公告)号:CN115278908A
公开(公告)日:2022-11-01
申请号:CN202210899466.4
申请日:2022-07-28
Applicant: 北京科技大学
Abstract: 本发明提供了一种无线资源分配优化方法及装置,涉及无线通信技术领域。包括:对无线设备进行优先级划分,得到不同优先级的无线设备;对所述不同优先级的无线设备设置不同的接入限制因子;通过基站建立智能体模型,对各类接入限制因子进行决策;通过近端策略优化PPO算法对智能体模型进行训练,获得即时奖励以及智能体模型的不同状态;将所述即时奖励以及智能体模型的不同状态作为转移经验;计算目标函数,通过转移经验对所述目标函数进行深度学习,完成无线资源的分配优化。本发明通过引入裁剪替代目标函数,解决PG算法中步长难以确定的问题。通过迭代循环将证明基于PPO的随机资源分配优化方法及装置的独特性,实现随机接入资源分配的整体经济效益。
-
公开(公告)号:CN115278908B
公开(公告)日:2024-11-15
申请号:CN202210899466.4
申请日:2022-07-28
Applicant: 北京科技大学
IPC: H04W72/566 , H04W72/53 , H04W74/0833 , G06N3/045 , G06N3/08
Abstract: 本发明提供了一种无线资源分配优化方法及装置,涉及无线通信技术领域。包括:对无线设备进行优先级划分,得到不同优先级的无线设备;对所述不同优先级的无线设备设置不同的接入限制因子;通过基站建立智能体模型,对各类接入限制因子进行决策;通过近端策略优化PPO算法对智能体模型进行训练,获得即时奖励以及智能体模型的不同状态;将所述即时奖励以及智能体模型的不同状态作为转移经验;计算目标函数,通过转移经验对所述目标函数进行深度学习,完成无线资源的分配优化。本发明通过引入裁剪替代目标函数,解决PG算法中步长难以确定的问题。通过迭代循环将证明基于PPO的随机资源分配优化方法及装置的独特性,实现随机接入资源分配的整体经济效益。
-