一种鲁棒的智能选频对抗博弈模型及学习方法
摘要:
本发明公开了一种鲁棒的智能选频对抗博弈模型及学习方法。考虑一个由红蓝双方组成的通信对抗场景,蓝色方包括两个用户和一个基站,红方则包括一个干扰机。干扰机可采取固定模式、反应式和主动式等多样化的干扰策略。为获得鲁棒的抗干扰通信效果,通信方引入虚拟干扰进行对抗训练。由于无法获取干扰方的信息,通信方只能参照自身参数来配置虚拟干扰。为避免对某一虚拟干扰过拟合,进一步引入虚拟智能体库以保证对手的多样性。虚拟干扰定期将历史版本的策略作为独立智能体保存至虚拟智能体库,通信方则按照规则从该库中挑选出作为对手进行对抗训练,从而获得鲁棒的选频抗干扰策略。本发明模型完备,物理意义清晰,算法设计合理有效,能够很好地刻画智能选频对抗场景。
0/0