-
公开(公告)号:CN115242271B
公开(公告)日:2023-06-16
申请号:CN202210892708.7
申请日:2022-07-27
Applicant: 南京邮电大学
IPC: H04B7/0413 , H04B17/30
Abstract: 一种强化学习辅助的大规模MIMO的Damped‑BP检测方法,采用强化学习中的Q‑Learning算法寻找阻尼置信传播Damped‑BP算法中的最佳阻尼因子,以此来提升Damped‑BP检测算法的性能。将Damped‑BP算法中的阻尼因子大小作为Q‑Learning算法中的状态,动作设置为增大或减小阻尼因子,形成Q‑Table。通过每次BP算法得到的误码率大小来决定给系统一个正向还是负向的回馈,误码率小,则给一个正向的回报;误码率大,则给一个负向的回报。这样,通过合理设置Q‑Learning算法中的学习率、折扣因子以及训练次数,得到在某种动作下回报最大的状态,与之对应的阻尼因子也就是最佳阻尼因子,从而完成最佳阻尼因子寻找,提升了Damped‑BP检测算法的性能,进而提升大规模MIMO的检测性能,能更好地满足实际通信高可靠低时延需求。
-
公开(公告)号:CN115242271A
公开(公告)日:2022-10-25
申请号:CN202210892708.7
申请日:2022-07-27
Applicant: 南京邮电大学
IPC: H04B7/0413 , H04B17/30
Abstract: 一种强化学习辅助的大规模MIMO的Damped‑BP检测方法,采用强化学习中的Q‑Learning算法寻找阻尼置信传播Damped‑BP算法中的最佳阻尼因子,以此来提升Damped‑BP检测算法的性能。将Damped‑BP算法中的阻尼因子大小作为Q‑Learning算法中的状态,动作设置为增大或减小阻尼因子,形成Q‑Table。通过每次BP算法得到的误码率大小来决定给系统一个正向还是负向的回馈,误码率小,则给一个正向的回报;误码率大,则给一个负向的回报。这样,通过合理设置Q‑Learning算法中的学习率、折扣因子以及训练次数,得到在某种动作下回报最大的状态,与之对应的阻尼因子也就是最佳阻尼因子,从而完成最佳阻尼因子寻找,提升了Damped‑BP检测算法的性能,进而提升大规模MIMO的检测性能,能更好地满足实际通信高可靠低时延需求。
-