对抗集群的训练方法及系统、对抗集群的对抗方法及系统

    公开(公告)号:CN119167095B

    公开(公告)日:2025-02-18

    申请号:CN202411652736.7

    申请日:2024-11-18

    Abstract: 本公开涉及人工智能和集群对抗技术领域,提供一种对抗集群的训练方法及系统、对抗集群的对抗方法及系统,该训练方法包括:将对抗数据实时存储到在线策略样本存储器中;每当在线策略样本存储器中的数据量超过预设的第一阈值,将数据转移到离线策略样本存储器中;从离线策略样本存储器中筛选出智能体的对抗指标最优的多个数据,得到过滤后的数据;基于在线策略样本存储器中的当前数据及过滤后的数据,确定策略梯度;基于策略梯度,更新对抗集群中的智能体的神经网络参数,以训练对抗集群。本公开可以解决集群的对抗能力弱、对抗策略固化和适应性差的问题,可以增强集群的对抗能力,提升集群持续学习演进,提高对抗策略的灵活性和适应性。

    基于连通保持约束的群体围捕方法及装置

    公开(公告)号:CN113268893B

    公开(公告)日:2021-10-01

    申请号:CN202110811042.3

    申请日:2021-07-19

    Abstract: 本发明提供一种基于连通保持约束的群体围捕方法及装置,方法包括:基于虚拟力场模型计算搜索指令,并与其他智能体形成保持通信的漫游状态;执行搜索指令以对区域进行目标搜索,若发现目标,则根据目标计算个体收益,并在个体收益小于或等于预设阈值时,独立围捕使个体收益最大的目标;否则,通过群体分布式通信机制将目标信息传送至其他临近智能体,接收其他临近智能体返回的任务分配方案,根据任务分配方案,基于选择性交互方法和虚拟力场模型计算围捕指令,并执行围捕指令以对目标进行围捕。本发明在通信保持约束条件下,同时考虑群体间各智能体与探测目标的作用,建立群体分布式协商机制,以实现群体无冲突的任务分配,进而快速围捕目标。

    面向短道速滑或速度滑冰项目的分段跟踪计时方法和装置

    公开(公告)号:CN112687024A

    公开(公告)日:2021-04-20

    申请号:CN202110270282.7

    申请日:2021-03-12

    Abstract: 本发明提供一种面向短道速滑或速度滑冰项目的分段跟踪计时方法和装置,其中方法包括:基于超宽带定位装置采集的任一运动员的定位信息,计算该运动员经过相邻两个激光计时器时的第一定位时间和第二定位时间;基于第一定位时间和第二定位时间,查询激光计时器采集的第一撞线时间和第二撞线时间;基于第一定位时间、第二定位时间、第一撞线时间和第二撞线时间,确定第一激光计时器和第二激光计时器之间定位时钟与激光计时器时钟的转换关系;基于转换关系,对该运动员在第一激光计时器和第二激光计时器之间移动时采集的定位时间进行校正。本发明减少了超宽带定位装置的赛道方向计时误差,实现了高速、激烈竞速条件下轨迹点计时测量精度的显著提升。

    基于视觉的轴承密封件缺陷检测方法

    公开(公告)号:CN106404793B

    公开(公告)日:2020-02-28

    申请号:CN201610804970.6

    申请日:2016-09-06

    Abstract: 本发明公开了一种基于视觉的轴承密封件缺陷检测方法。其中,该方法包括获取轴承密封件图像;对轴承密封件图像运用图像分割和目标关联方法,得到轴承密封件的工件图像;对工件图像运用工件范围计算,得到轴承密封件的有效工件图像;对有效工件图像运用工件范围比对和方向差异判定方法,得到毛刺缺陷;对有效工件图像运用直方图分析方法,得到正面工件图像和反面工件图像;对正面工件图像运用颜色显著性和矩形特征判定方法,得到色差缺陷;对反面工件图像运用金属范围计算,得到工件金属部分图像;对工件金属部分图像运用亮度显著性和颜色变换方法,得到溢胶和锈蚀缺陷。通过本发明实施例解决了轴承密封件的在线检测问题,提升了自动化水平。

    一种视频中基于在线动态背景建模的运动目标检测方法

    公开(公告)号:CN105279771A

    公开(公告)日:2016-01-27

    申请号:CN201510696087.5

    申请日:2015-10-23

    CPC classification number: G06T2207/10016

    Abstract: 本发明公开了一种视频中基于在线动态背景建模的运动目标检测方法,包括以下步骤:采集图像并进行预处理;判读图像帧是否为第一帧,如果是则初始化背景模型,否则转到下一步;利用动态背景模型生成背景图像;在当前帧图像和背景图像中提取匹配点对;筛选精确匹配对并利用RANSAC计算校正参数;将动态背景模型校正到当前图像帧的坐标系;利用校正后的背景模型将当前帧图像的像素分为运动像素和背景像素;用背景像素对背景模型进行动态更新;对运动像素进行形态学处理、连通域分析及面积约束得到运动目标。本发明可以将固定平台下先进的基于背景建模的运动目标检测算法方便的用于航拍平台上,更精确的对运动目标进行检测。

    无人机视觉辅助导航方法及系统

    公开(公告)号:CN107690840B

    公开(公告)日:2013-07-31

    申请号:CN200910087397.1

    申请日:2009-06-24

    Abstract: 本发明涉及一种无人机视觉辅助导航方法及系统,该方法包括步骤:利用无人机地理信息系统的基准数据和飞行过程中实时采集的图像;对实时采集的图像运用视觉图像处理得到具有实际地理意义的视觉特征信息;将视觉特征信息与基准数据进行匹配,得到无人机的视觉定位结果;利用视觉定位结果对惯性导航系统的累积误差的导航数据进行修正。本发明通过GIS作为基准数据克服了景象匹配方法基准数据获取困难、存储量大、以及无法与任务相关联的缺陷,通过视觉图像特征的快速提取算法克服了地形匹配算法计算效率低的问题,使得该方法在无人机,特别是微型无人机上更加可行。

    群体对抗中智能体控制方法、装置、电子设备及存储介质

    公开(公告)号:CN113283574A

    公开(公告)日:2021-08-20

    申请号:CN202110828346.0

    申请日:2021-07-22

    Abstract: 本发明提供一种群体对抗中智能体控制方法、装置、电子设备及存储介质,该方法包括:获取第一智能体的状态特征、第一智能体周围各个对手的状态特征、第一对手的状态特征和第一对手周围各个智能体的状态特征;基于第一智能体的状态特征和第一智能体周围各个对手的状态特征,获得第一智能体周围环境状态特征;基于第一对手的状态特征和第一对手周围各个智能体的状态特征,获得第一智能体周围各个对手的总行为特征;基于第一智能体周围各个对手的总行为特征,获得第一智能体周围各个对手的深层总行为特征;基于第一智能体周围环境状态特征和第一智能体周围各个对手的深层总行为特征,获得交互特征;基于交互特征对第一智能体进行控制。控制效果良好。

    机器人导航方法、装置、电子设备及存储介质

    公开(公告)号:CN113282093A

    公开(公告)日:2021-08-20

    申请号:CN202110822386.4

    申请日:2021-07-21

    Abstract: 本发明提供一种机器人导航方法、装置、电子设备及存储介质,所述方法包括:获取机器人状态和机器人所处环境状态;通过时空图注意力网络对所述机器人状态和所述机器人所处环境状态共同进行特征编码,以获得机器人的高层策略层时空状态特征和低层策略层时空状态特征;基于所述高层策略层时空状态特征获得机器人的高层策略动作;基于所述高层策略动作计算获得子目标位置的误差状态;基于所述子目标位置的误差状态、所述机器人状态和所述低层策略层时空状态特征,获得机器人的低层策略动作;基于所述低层策略动作进行机器人导航。本方法能够高效地实现机器人无障碍导航。

    基于强化学习的飞行器姿态控制方法、系统、装置

    公开(公告)号:CN112198890B

    公开(公告)日:2021-04-13

    申请号:CN202011396912.7

    申请日:2020-12-03

    Abstract: 本发明属于飞行器控制领域,具体涉及一种基于强化学习的飞行器姿态控制方法、系统、装置,旨在为了解决低精度模型下实现无超调控制的问题。本发明基于强化学习的飞行器姿态控制方法,包括:获取第时刻的飞行器状态数据;基于飞行器的期望飞行轨迹,计算期望姿态角、姿态角跟踪误差,构建第时刻网络输入状态;基于所述第时刻网络输入状态、所述期望姿态角,通过DDPG深度强化学习网络获取最优控制动作;基于所述最优控制动作进行所述飞行器姿态调整。本发明可以在低精度模型下实现无超调控制,调节时间短,稳态误差小。

    基于知识嵌入的区域覆盖和连通保持的集群控制方法

    公开(公告)号:CN112203291A

    公开(公告)日:2021-01-08

    申请号:CN202011393769.6

    申请日:2020-12-03

    Abstract: 本发明属于无人集群系统协同技术领域,具体涉及了一种基于知识嵌入的区域覆盖和连通保持的集群控制方法,旨在解决现有技术无法在实现目标覆盖最大化的同时有效保证集群中智能体之间的连通性,因而智能体控制效果不佳的问题。本发明包括:提取群体中各智能体和目标的状态信息的相对特征;提取邻居各智能体对目标的意图特征和交互信息,并扩展感受野;设计群体奖惩函数,计算智能体选择累计回报最大的动作;删除冗余重要连接边,获得目标覆盖最大化的重要连接图和重要性节点集合;计算保证通信拓扑图实时连通的智能体最大步长,对动作进行约束截断,输出到集群智能体。本发明将知识和数据方法相结合,能够快速实现集群连通保持下的目标覆盖最大化。

Patent Agency Ranking