免授权频段上的一种智能共存方法
摘要:
本发明涉及一种免授权频段上的一种智能共存方法,属于无线通信技术领域。本发明包括以下步骤:S1:设计LAA小基站动作集合、奖励函数以及状态集合;S2:初始化环境,LAA小基站获取初始状态值st;S3:根据ε‑greedy策略,LAA小基站以概率ε随机选择动作,以概率(1‑ε)选择最大Q值对应的动作at;S4:执行动作at后,LAA小基站获取环境奖励值rt,并将一次交互得到的经验样本 存入记忆池中,然后进入下一个状态st+1;S5:LAA小基站以批量化的方式将经验样本喂给估计值网络,以更新神经网络权重θ,调整对Q值的估算方式;S6:重复步骤S5‑S7,直到得到最佳接入策略π*(s)。
公开/授权文献
0/0