-
公开(公告)号:CN111125448B
公开(公告)日:2023-04-07
申请号:CN201911337772.3
申请日:2019-12-23
申请人: 中国航空工业集团公司沈阳飞机设计研究所
IPC分类号: G06F16/901 , G06F16/903
摘要: 本申请提供了一种大规模空中任务决策方法,所述方法包括:获取已知的空中任务决策知识体系;根据已知的空中任务决策知识体系构建空中任务决策的非全区域决策规则;根据所述非全区域决策规则生成全区域决策规则并填入哈希空间中;根据所述哈希空间中的全区域决策规则执行空中任务的决策。与现有技术相比,本申请以现有技术的人类知识为基础,将其解析成若干条不完全划分的决策规则,之后自动生成完全划分的排列组合决策规则并自动映射到哈希解空间,解决了决策系统的规则填写问题,为高维大规模的飞机空中任务决策提供了高效的解决方案。
-
公开(公告)号:CN110989649B
公开(公告)日:2023-07-25
申请号:CN201911364796.8
申请日:2019-12-26
申请人: 中国航空工业集团公司沈阳飞机设计研究所
摘要: 本申请属于无人机飞行器控制技术领域,特别涉及一种面向高机动固定翼无人机的飞行动作控制装置及训练方法;控制装置包括:上层控制器,用于宏观无人机飞行动作选择;下层控制器,用于对上层选择的飞行动作进行相对精细的连续引导指令优化;控制装置的训练方法包括如下步骤:对上层控制器和下层控制器进行双层神经网络控制;对所述上层控制器和下层控制器进行双层神经网络训练。本申请的面向高机动固定翼无人机的飞行动作控制装置及训练方法,通过上下两层指令协调控制,避免了只控制飞行轨迹产生的较大的指令滞后;另外,通过分层强化学习方法,避免人为设计只能覆盖数个设计点导致的局限性,且能够适应场景发生变化,实现控制器自学习和自演化。
-
公开(公告)号:CN111125448A
公开(公告)日:2020-05-08
申请号:CN201911337772.3
申请日:2019-12-23
申请人: 中国航空工业集团公司沈阳飞机设计研究所
IPC分类号: G06F16/901 , G06F16/903
摘要: 本申请提供了一种大规模空中任务决策方法,所述方法包括:获取已知的空中任务决策知识体系;根据已知的空中任务决策知识体系构建空中任务决策的非全区域决策规则;根据所述非全区域决策规则生成全区域决策规则并填入哈希空间中;根据所述哈希空间中的全区域决策规则执行空中任务的决策。与现有技术相比,本申请以现有技术的人类知识为基础,将其解析成若干条不完全划分的决策规则,之后自动生成完全划分的排列组合决策规则并自动映射到哈希解空间,解决了决策系统的规则填写问题,为高维大规模的飞机空中任务决策提供了高效的解决方案。
-
公开(公告)号:CN111047014A
公开(公告)日:2020-04-21
申请号:CN201911266811.5
申请日:2019-12-11
申请人: 中国航空工业集团公司沈阳飞机设计研究所
摘要: 本申请属于多智能体空中对抗博弈领域,特别涉及一种多智能体空中对抗分布式采样训练方法及设备。方法包括:步骤一:获取学习节点以及采样节点,并建立所述学习节点与所述采样节点之间的联系,以及初始化多智能体空中对抗网络;步骤二:所述学习节点向所述采样节点发送采样指令,所述采样节点接收所述采样指令并开始采样,所述采样节点采集样本后将所述样本发送给所述学习节点;步骤三:所述学习节点通过样本进行训练,更新并保存所述多智能体空中对抗网络。本申请可以完成多智能体空中对抗网络的分布式采样与训练,提升系统的样本采集、传输效率与对抗网络训练效率。
-
公开(公告)号:CN110727289A
公开(公告)日:2020-01-24
申请号:CN201911174415.X
申请日:2019-11-26
申请人: 中国航空工业集团公司沈阳飞机设计研究所
IPC分类号: G05D1/10
摘要: 本申请属于无人机飞行控制技术领域,具体涉及一种无人机飞行控制方法,包括:在远距接战时,设置无人机的机动模式为拦射机动;在发射弹药后,设置无人机的机动模式为偏置机动;在躲避敌方锁定时,设置无人机的机动模式为横切机动;在躲避导弹攻击时,设置无人机的机动模式为逃逸机动、斜拉回环机动或者破S机动。
-
公开(公告)号:CN107730004A
公开(公告)日:2018-02-23
申请号:CN201710851136.7
申请日:2017-09-20
申请人: 中国航空工业集团公司沈阳飞机设计研究所
摘要: 本发明提供一种自我策略迭代吸收的GFT智能决策模型自搏训练方法,如下步骤:从自搏训练的第N代开始,对前N代的GFT算法模型的策略对抗能力进行排序;挑选出最好的n个GFT算法模型,进行组合,保证n个权值的总和为1,形成第N代的组合GFT;选用启发式优化方法,在策略对抗中对n个总和为1的GFT的权值进行优化,得到优化后的n个权值;对n个权值进行排序,删除其中权值较小的m个GFT,m
-
公开(公告)号:CN107563516A
公开(公告)日:2018-01-09
申请号:CN201710769159.3
申请日:2017-08-31
申请人: 中国航空工业集团公司沈阳飞机设计研究所
摘要: 本发明提供一种对模糊规则及隶属度函数的混合编码方法,包括如下步骤:通过IF THEN条件语句形式表示模糊规则,IF表示条件,THEN表示输出;将所有模糊规则的输入及取值用矩阵的形式表示,矩阵的维数是输入的个数,每个维度的元素是其对应输入的取值,进而维度中元素的个数是其对应输入的个数,矩阵中的元素就是输出的值,将矩阵中的元素从第一行到最后一行按照列的顺序进行排列,得到需进行遗传操作的基因序列A;将隶属度函数曲线的交点及顶点两者对应的横坐标正向依次排列,得到编码序列B;将基因序列A与编码序列B并列排列得到所需混合编码。本发明所提供的编码方法,可以极大缩减编码位数,并因此减少计算的时间及空间复杂度。
-
公开(公告)号:CN111047014B
公开(公告)日:2023-06-23
申请号:CN201911266811.5
申请日:2019-12-11
申请人: 中国航空工业集团公司沈阳飞机设计研究所
摘要: 本申请属于多智能体空中对抗博弈领域,特别涉及一种多智能体空中对抗分布式采样训练方法及设备。方法包括:步骤一:获取学习节点以及采样节点,并建立所述学习节点与所述采样节点之间的联系,以及初始化多智能体空中对抗网络;步骤二:所述学习节点向所述采样节点发送采样指令,所述采样节点接收所述采样指令并开始采样,所述采样节点采集样本后将所述样本发送给所述学习节点;步骤三:所述学习节点通过样本进行训练,更新并保存所述多智能体空中对抗网络。本申请可以完成多智能体空中对抗网络的分布式采样与训练,提升系统的样本采集、传输效率与对抗网络训练效率。
-
公开(公告)号:CN113918451A
公开(公告)日:2022-01-11
申请号:CN202111062056.6
申请日:2021-09-10
申请人: 中国航空工业集团公司沈阳飞机设计研究所
IPC分类号: G06F11/36
摘要: 本申请涉及航空机器学习领域,为一种免模型强化学习的软件测试方法,包括根据要测试的功能集,构建测试条件集C,构建被测软件的观测空间O,构建测试动作空间A,形成测试模拟环境;构建对动作序列执行效果进行奖赏的奖赏函数;构建能够作用于软件本身的动作执行驱动接口;构建能够自我学习的测试策略网络;构建免模型的强化学习损失函数;驱动测试策略网络实时生成软件操作动作并通过动作执行驱动接口作用于软件,进行计算并记录数据元组,存入数据集;所述强化学习损失函数利用数据集优化测试策略网络参数。具有测试效率高、测试时间短、准确性高的技术效果。
-
公开(公告)号:CN107730004B
公开(公告)日:2021-12-28
申请号:CN201710851136.7
申请日:2017-09-20
申请人: 中国航空工业集团公司沈阳飞机设计研究所
摘要: 本发明提供一种自我策略迭代吸收的GFT智能决策模型自搏训练方法,如下步骤:从自搏训练的第N代开始,对前N代的GFT算法模型的策略对抗能力进行排序;挑选出最好的n个GFT算法模型,进行组合,保证n个权值的总和为1,形成第N代的组合GFT;选用启发式优化方法,在策略对抗中对n个总和为1的GFT的权值进行优化,得到优化后的n个权值;对n个权值进行排序,删除其中权值较小的m个GFT,m
-
-
-
-
-
-
-
-
-