-
公开(公告)号:CN119167095B
公开(公告)日:2025-02-18
申请号:CN202411652736.7
申请日:2024-11-18
Applicant: 中国科学院自动化研究所
IPC: G06F18/214 , G06N3/0464 , G06N3/08
Abstract: 本公开涉及人工智能和集群对抗技术领域,提供一种对抗集群的训练方法及系统、对抗集群的对抗方法及系统,该训练方法包括:将对抗数据实时存储到在线策略样本存储器中;每当在线策略样本存储器中的数据量超过预设的第一阈值,将数据转移到离线策略样本存储器中;从离线策略样本存储器中筛选出智能体的对抗指标最优的多个数据,得到过滤后的数据;基于在线策略样本存储器中的当前数据及过滤后的数据,确定策略梯度;基于策略梯度,更新对抗集群中的智能体的神经网络参数,以训练对抗集群。本公开可以解决集群的对抗能力弱、对抗策略固化和适应性差的问题,可以增强集群的对抗能力,提升集群持续学习演进,提高对抗策略的灵活性和适应性。
-
公开(公告)号:CN116414141A
公开(公告)日:2023-07-11
申请号:CN202310068735.7
申请日:2023-02-06
Applicant: 中国科学院自动化研究所
Abstract: 本发明涉及飞行器控制与决策技术领域,尤其涉及一种基于分层强化学习算法的飞行器决策方法和决策装置。其中,基于分层强化学习算法的飞行器决策方法包括:首先分别获取第一飞行器和目标飞行器在六自由度控制模型下的第一控制量和第二控制量;然后将第一控制量和第二控制量输入到训练好的三自由度控制决策模型中,得到第一飞行器在三自由度控制模型下的第三控制量;在将第三控制量输入到六自由度控制器中,得到第一飞行器在六自由度控制模型下的第四控制量;最后依据第四控制量控制第一飞行器运行,在保证控制的精度基础上,完成第一飞行器飞行决策。
-
公开(公告)号:CN115793717B
公开(公告)日:2023-05-05
申请号:CN202310104054.1
申请日:2023-02-13
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供一种群体协同决策方法、装置、电子设备及存储介质,涉及人工智能技术领域,该方法包括:基于目标无人机的局部观测信息得到观测表征向量;基于目标无人机的局部通信信息得到交互表征向量;融合观测表征向量及交互表征向量,得到环境表征向量;基于环境表征向量对目标无人机进行群体协同策略更新,由此通过根据融合后得到的环境表征向量进行群体协同策略进行更新,得到最优运行策略,以根据最优运行策略完成协同围捕任务,实现了有效地处理群体系统中无人机动态多变的局部观测信息和局部通信信息,促进无人机之间合作,提高无人机在动态变化环境下的协同围捕决策能力。
-
公开(公告)号:CN115016546B
公开(公告)日:2022-10-28
申请号:CN202210953534.0
申请日:2022-08-10
Applicant: 中国科学院自动化研究所
IPC: G05D1/10
Abstract: 本发明提供一种无人机三维路径规划方法、装置、电子设备和存储介质,涉及无人机技术领域,所述方法包括:获取无人机当前路径点的局部感知信息;将无人机当前路径点的局部感知信息输入至视场模型,确定无人机当前视场的可飞区域和禁飞区域;在无人机下个路径点处于禁飞区域的情况下,确定无人机当前视场内处于可飞区域内的至少两个采样路径点,并将至少两个采样路径点中代价最小的采样路径点确定为安全路径点;基于安全路径点更新全局初始路径。本发明基于局部感知信息进行无人机的三维路径规划,生成无人机在复杂障碍环境下的自主安全路径。
-
公开(公告)号:CN114815900A
公开(公告)日:2022-07-29
申请号:CN202210715655.1
申请日:2022-06-23
Applicant: 中国科学院自动化研究所
IPC: G05D1/10
Abstract: 本发明提供一种无人集群对抗方法、装置、电子设备及存储介质,涉及无人设备自动化技术领域,该方法包括:根据第一无人集群,确定多个第一子集群,第一无人集群包括多个第一无人设备;根据第二无人集群,确定多个第二子集群,第二无人集群包括多个第二无人设备;获取第一目标集群与第一无人集群中每个第一子集群之间的关联参数,并根据关联参数,在多个第一子集群中确定第一目标集群对应的第二目标集群,第一目标集群为多个第二子集群中的任一子集群;控制第一目标集群对抗第二目标集群。该方法用以实现在复杂环境下,电子设备能够控制第二无人集群对第一无人集群进行高效的动态对抗,以提高该第二无人集群有效对抗该第一无人集群的成功率。
-
公开(公告)号:CN113962032B
公开(公告)日:2022-04-08
申请号:CN202111566939.0
申请日:2021-12-21
Applicant: 中国科学院自动化研究所
IPC: G06F30/15 , G06F30/20 , G06F17/16 , G06F119/12
Abstract: 本发明提供一种空战机动决策方法及装置,所述方法包括:根据飞行器实际性能限制因素,构建飞行器空战模型;根据在飞行控制系统控制下的飞行器状态的动态响应的时间,分别为不同的飞行器状态设置不同的决策周期;根据在设置决策周期后的飞行器状态,分别确定不同的飞行器状态对应的目标空战机动指令;根据目标空战机动指令和飞行器空战模型,对飞行器进行空战机动决策;其中,飞行器状态包括:高度、航向角和速度。本发明提供的空战机动决策方法及装置,通过不同的飞行器状态在控制系统下的动态响应特性,分别为不同的飞行器状态的机动决策设置不同的决策周期,可有效减轻空战机动决策实时性和准确性之间的矛盾,实现快速高效的空战机动决策。
-
公开(公告)号:CN113987849A
公开(公告)日:2022-01-28
申请号:CN202111617156.0
申请日:2021-12-28
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供一种空战对抗算法的评估方法及装置,所述方法包括:根据红方飞行器的运动状态、红方飞行器的探测状态和红方飞行器的武器状态,以及蓝方飞行器的运动状态、蓝方飞行器的探测状态和蓝方飞行器的武器状态,对红方飞行器和蓝方飞行器进行演练,确定红蓝双方的胜负关系;根据所述胜负关系,确定待评估空战对抗算法相对于基准对抗算法的胜率,根据胜率,确定待评估空战对抗算法的评估结果。本发明提供的空战对抗算法的评估方法及装置,通过对红方飞行器和蓝方飞行器进行演练,根据演练的胜率确定待评估空战对抗算法相对于基准对抗算法的评估结果,实现了对于空战对抗算法科学、准确的评估。
-
公开(公告)号:CN113268893B
公开(公告)日:2021-10-01
申请号:CN202110811042.3
申请日:2021-07-19
Applicant: 中国科学院自动化研究所
IPC: G06F30/20 , G06Q10/06 , G06N3/00 , G06F111/04 , G06F119/14
Abstract: 本发明提供一种基于连通保持约束的群体围捕方法及装置,方法包括:基于虚拟力场模型计算搜索指令,并与其他智能体形成保持通信的漫游状态;执行搜索指令以对区域进行目标搜索,若发现目标,则根据目标计算个体收益,并在个体收益小于或等于预设阈值时,独立围捕使个体收益最大的目标;否则,通过群体分布式通信机制将目标信息传送至其他临近智能体,接收其他临近智能体返回的任务分配方案,根据任务分配方案,基于选择性交互方法和虚拟力场模型计算围捕指令,并执行围捕指令以对目标进行围捕。本发明在通信保持约束条件下,同时考虑群体间各智能体与探测目标的作用,建立群体分布式协商机制,以实现群体无冲突的任务分配,进而快速围捕目标。
-
公开(公告)号:CN111738372B
公开(公告)日:2020-11-17
申请号:CN202010873794.8
申请日:2020-08-26
Applicant: 中国科学院自动化研究所
Abstract: 本发明提出了一种分布式多智能体时空特征提取方法、行为决策方法。本发明的行为决策方法包括:获取当前时刻及前若干时刻智能体所能感知的状态信息,构建时空状态向量;将时空状态向量输入图网络生成层,输出智能体的原始特征向量;将原始特征向量输入空间特征提取层,输出空间关系特征向量;将空间关系特征向量输入时空特征提取层,输出时空关系特征向量;基于所得到的时空关系特征向量,计算智能体在当前时刻下的行为决策;更新时间步,计算下一时刻智能体的时空特征和行为决策。本发明实现了多智能体系统在复杂环境、时变拓扑、有限资源等约束下的分布式时空特征关系的提取,提升了多智能体系统在大规模复杂任务中的自适应能力和性能鲁棒性。
-
公开(公告)号:CN111738372A
公开(公告)日:2020-10-02
申请号:CN202010873794.8
申请日:2020-08-26
Applicant: 中国科学院自动化研究所
Abstract: 本发明提出了一种分布式多智能体时空特征提取方法、行为决策方法。本发明的行为决策方法包括:获取当前时刻及前若干时刻智能体所能感知的状态信息,构建时空状态向量;将时空状态向量输入图网络生成层,输出智能体的原始特征向量;将原始特征向量输入空间特征提取层,输出空间关系特征向量;将空间关系特征向量输入时空特征提取层,输出时空关系特征向量;基于所得到的时空关系特征向量,计算智能体在当前时刻下的行为决策;更新时间步,计算下一时刻智能体的时空特征和行为决策。本发明实现了多智能体系统在复杂环境、时变拓扑、有限资源等约束下的分布式时空特征关系的提取,提升了多智能体系统在大规模复杂任务中的自适应能力和性能鲁棒性。
-
-
-
-
-
-
-
-
-