一种基于深度增强学习的无线网络资源分配方法

    公开(公告)号:CN109474980B

    公开(公告)日:2020-04-28

    申请号:CN201811535056.1

    申请日:2018-12-14

    Abstract: 本发明提供一种基于深度增强学习的无线网络资源分配方法,能够以较低复杂度最大限度地提高时变信道环境中的能量效率。所述方法包括:建立深度增强学习模型;将基站与用户终端之间的时变信道环境建模为有限状态的时变马尔科夫信道,确定归一化信道系数,并输入卷积神经网络qeval,选择输出回报值最大的动作作为决策动作,为用户分配子载波;根据子载波分配结果,基于信道系数的反比为每个子载波上复用的用户分配下行功率,基于分配的下行功率确定回报函数,并将回报函数反馈回深度增强学习模型;根据确定的回报函数,训练深度增强学习模型中的卷积神经网络qeval、qtarget,确定时变信道环境下功率局部最优分配。本发明涉及无线通信以及人工智能决策领域。

    一种基于深度增强学习的无线网络资源分配方法

    公开(公告)号:CN109474980A

    公开(公告)日:2019-03-15

    申请号:CN201811535056.1

    申请日:2018-12-14

    Abstract: 本发明提供一种基于深度增强学习的无线网络资源分配方法,能够以较低复杂度最大限度地提高时变信道环境中的能量效率。所述方法包括:建立深度增强学习模型;将基站与用户终端之间的时变信道环境建模为有限状态的时变马尔科夫信道,确定归一化信道系数,并输入卷积神经网络qeval,选择输出回报值最大的动作作为决策动作,为用户分配子载波;根据子载波分配结果,基于信道系数的反比为每个子载波上复用的用户分配下行功率,基于分配的下行功率确定回报函数,并将回报函数反馈回深度增强学习模型;根据确定的回报函数,训练深度增强学习模型中的卷积神经网络qeval、qtarget,确定时变信道环境下功率局部最优分配。本发明涉及无线通信以及人工智能决策领域。

Patent Agency Ranking