-
公开(公告)号:CN115688922A
公开(公告)日:2023-02-03
申请号:CN202211342497.6
申请日:2022-10-31
Applicant: 西安交通大学
Abstract: 本发明公开了一种提升多智能体复杂博弈系统整体效益的空策略方法,基于多体演化博弈动力学的微观相互作用机制,充分融合了人工智能领域中经典强化学习算法,通过引入空策略的方式,在复杂的资源配置系统中实现无外部干预条件下羊群效应的抑制,进而显著提升多智能体系统效益。构建多智能体博弈空策略融合模型,系统中个体认知决策,试错探索,理智决策,环境进行奖励反馈,智能体Q矩阵更新,进入下一个循环周期。本发明将强化学习应用于演化博弈背景下的多智能体系统优化方法中,同时通过引入空策略的方式,提升多智能体资源优化配置的效能,实现收益显著提升、学习效率、远期收益评估及收敛性可控等多样化参数设置,具有重要的实际应用价值。