一种基于强化学习的时延敏感网络发射功率自适应分配方法
摘要:
本申请涉及一种基于强化学习的时延敏感网络发射功率自适应分配方法,包括以下步骤:步骤1:接收端根据过时的信道状态信息估计瞬时的信噪比并反馈给发射端,发射端基于接收端反馈的信息,对当前时隙的发射功率进行选取;步骤2:根据每个时隙间信道的相关性,上一次传输的发射功率、解码情况以及当前时隙估计的瞬时SNR,建立状态函数,发射端基于接收端反馈信息决定是否需要进行重传;步骤3:设计奖励机制处理让模型学习平衡总功率约束,从而最小化时延抖动。本发明解决了现有传统方法对时延敏感网络场景下的发射功率设计的局限性,在保障通信可靠性的同时降低了时延抖动,提升了确定性。
0/0