-
公开(公告)号:CN118966646A
公开(公告)日:2024-11-15
申请号:CN202411005417.7
申请日:2024-07-25
Applicant: 东南大学 , 北京京航计算通讯研究所
IPC: G06Q10/0631 , G06N5/04 , G06N3/0442 , G06N3/042 , G06N3/092
Abstract: 本发明提供了一种针对无人机群中辅助任务不确定到达时间特性的任务目标分配方法,以解决大规模混杂智能无人机群体面对周期性到达的辅助任务决策时的局部最优性问题。在高动态博弈场景中,智能无人机群体需要执行的任务分为主要任务与辅助任务,辅助任务完成可以对主要任务起辅助作用,降低其执行时间。面对实际对抗环境中辅助任务的到达时间与影响范围不确定的情况,提出以下方法。首先,该方法构建任务之间的注意力模型为任务计算特征向量;其次,任务的到达时间等属性结合构建智能体和任务之间的注意力模型;最后,使用分层强化学习的方法对任务进行分配处理。本方法加快了任务整体的完成时间,提高了系统的存活率。
-
公开(公告)号:CN118966647A
公开(公告)日:2024-11-15
申请号:CN202411005425.1
申请日:2024-07-25
Applicant: 东南大学
IPC: G06Q10/0631 , G06N5/04 , G06N3/042 , G06N3/092 , G06N3/044
Abstract: 本发明提出了一种针对高动态博弈场景中无人机群体的辅助任务截止时间特性的任务分配方法。该方法旨在解决辅助任务超时消失对系统稳定性的影响。辅助任务在截止时间前完成可加速其他任务的完成。在高动态博弈场景下,辅助任务的作用范围并不确定,辅助任务之间的级联扩散影响也不确定,增大了问题的复杂度。本发明首先对任务进行时间编码,生成特征向量;然后计算任务截止优先级并更新智能体特征;最后应用多智能体系统决策学习进行任务分配。与现有方法相比,本发明通过时间编码和截止优先级的计算,结合注意力机制,有效提升了任务完成率和系统在复杂博弈环境中的存活率。
-
公开(公告)号:CN116776963A
公开(公告)日:2023-09-19
申请号:CN202310637974.X
申请日:2023-05-31
Applicant: 东南大学
Abstract: 本发明提出了针对对抗场景下不确定性辅助任务的分层强化学习方法。首先进行上层的任务分配阶段,智能体先获取全局环境信息,然后提取出其中对自身重要的辅助任务信息,再基于此提取出重要的主要任务信息,最后结合其它智能体的信息学习出任务分配策略;然后进行下层的任务执行阶段,智能体先根据分配结果构建专属子环境,然后在子环境内学习出任务执行顺序,最后执行具体动作。本专利提出的分层强化学习算法可以更高效地帮助多智能体系统学习如何执行不确定辅助任务,通过先学习上层的多智能体不确定辅助任务分配策略,再学习下层的单智能体不确定辅助任务执行策略,分别解决不确定辅助任务对群体和个体的影响,可以有效降低问题的复杂度。
-
-