一种网络资源共享方法、装置、设备及可读存储介质
摘要:
本发明提出了一种网络资源共享方法、装置、设备及可读存储介质。所述方法将网络中的通信终端分为AOI敏感型终端和AOI容忍型终端;考虑混合频谱共享的网络接入方式,构建终端通信模型;构造基于AOI和有效传输速率的多目标系统效用函数,建立基于混合频谱共享的网络资源的长期优化问题;最后利用马尔科夫决策过程将所提问题构造为长期效用问题,以基站为智能体并利用深度确定性策略梯度DDPG方法构建基于表演家‑批评家结构的深度强化学习框架,通过评价网络与动作网络相互迭代更新,智能体在实现有效的在线学习后,仅需本地状态信息即可快速进行资源的高效分配。本发明有效的满足了两类终端的通信需求,保障了系统的可靠运行,提升了频谱使用效率。
0/0