-
公开(公告)号:CN116234047B
公开(公告)日:2024-07-12
申请号:CN202310254852.2
申请日:2023-03-16
Applicant: 华能伊敏煤电有限责任公司
IPC: H04W72/542 , H04W72/52 , H04W72/53 , H04W72/1273 , H04W72/0446 , H04W72/0453 , G06N3/045 , G06N3/092
Abstract: 本发明公开了一种基于强化学习算法的混合业务智能资源调度方法,在每个slot初期利用强化学习算法进行eMBB业务的资源调度,通过环境信息预测URLLC的流量模型和抢占模型,减少URLLC业务抢占造成的eMBB业务吞吐量损失。在每个mini‑slot初期利用抢占调度进行URLLC业务的资源调度,从而满足其时延需求。本发明在时隙划分的基础上采用抢占算法为URLLC用户分配频谱资源,同时采用强化学习算法为eMBB用户分配频谱资源,在保证URLLC业务时延需求的同时减少eMBB业务的吞吐量损失,提高系统整体的性能。本发明适用于5G背景下的下行调度场景。
-
公开(公告)号:CN117062095B
公开(公告)日:2025-02-11
申请号:CN202311112408.3
申请日:2023-08-31
Applicant: 华能伊敏煤电有限责任公司
IPC: H04W16/22 , H04L41/142 , H04L41/147 , H04L41/16 , H04B7/0413 , H04B7/06 , H04B7/08
Abstract: 本发明涉及一种基于人工智能算法的多用户波束预测方法,该方法包括以下步骤:构建总的目标优化函数;将一个时隙划分为T个微小时隙;在每一个微小时隙下,采用深度确定性策略梯度算法对波束进行预测,得到波束选择的全局最优方案,所述深度确定性策略梯度算法的状态空间建立为t‑1时隙每个用户选择的波束,动作空间建立为t时隙下每个用户选择每个预编码变化幅度的概率矩阵,奖励函数建立为t时刻所有用户接收信号的模值之和。本发明通过将多用户复杂的预编码矩阵选择转变为统一的预编码矩阵的变化幅度选择,降低了动作空间的维度,加快了网络的收敛速率,同时降低了算法训练所需的算力开销,提升了预测方法的泛用性。
-
公开(公告)号:CN117062095A
公开(公告)日:2023-11-14
申请号:CN202311112408.3
申请日:2023-08-31
Applicant: 华能伊敏煤电有限责任公司
IPC: H04W16/22 , H04L41/142 , H04L41/147 , H04L41/16 , H04B7/0413 , H04B7/06 , H04B7/08
Abstract: 本发明涉及一种基于人工智能算法的多用户波束预测方法,该方法包括以下步骤:构建总的目标优化函数;将一个时隙划分为T个微小时隙;在每一个微小时隙下,采用深度确定性策略梯度算法对波束进行预测,得到波束选择的全局最优方案,所述深度确定性策略梯度算法的状态空间建立为t‑1时隙每个用户选择的波束,动作空间建立为t时隙下每个用户选择每个预编码变化幅度的概率矩阵,奖励函数建立为t时刻所有用户接收信号的模值之和。本发明通过将多用户复杂的预编码矩阵选择转变为统一的预编码矩阵的变化幅度选择,降低了动作空间的维度,加快了网络的收敛速率,同时降低了算法训练所需的算力开销,提升了预测方法的泛用性。
-
公开(公告)号:CN116234047A
公开(公告)日:2023-06-06
申请号:CN202310254852.2
申请日:2023-03-16
Applicant: 华能伊敏煤电有限责任公司
IPC: H04W72/542 , H04W72/52 , H04W72/53 , H04W72/1273 , H04W72/0446 , H04W72/0453 , G06N3/045 , G06N3/092
Abstract: 本发明公开了一种基于强化学习算法的混合业务智能资源调度方法,在每个slot初期利用强化学习算法进行eMBB业务的资源调度,通过环境信息预测URLLC的流量模型和抢占模型,减少URLLC业务抢占造成的eMBB业务吞吐量损失。在每个mini‑slot初期利用抢占调度进行URLLC业务的资源调度,从而满足其时延需求。本发明在时隙划分的基础上采用抢占算法为URLLC用户分配频谱资源,同时采用强化学习算法为eMBB用户分配频谱资源,在保证URLLC业务时延需求的同时减少eMBB业务的吞吐量损失,提高系统整体的性能。本发明适用于5G背景下的下行调度场景。
-
-
-