-
公开(公告)号:CN116542333A
公开(公告)日:2023-08-04
申请号:CN202310235741.7
申请日:2023-03-13
Applicant: 中国科学院自动化研究所
IPC: G06N5/04 , G06F18/214
Abstract: 本申请实施例提供一种博弈环境系统、博弈智能体以及兵棋智能体的训练方法。其中,所述博弈环境系统包括:第一step接口、博弈环境引擎;其中,博弈环境引擎包括动作管理模块;第一step接口用于:对于多个博弈智能体中的任一博弈智能体,从当前博弈智能体的第二step接口,获取当前博弈智能体的动作信息,基于博弈环境引擎采用的推进机制,按照预设处理方式,对动作信息进行处理;将从动作管理模块获取到的动作信息对应的不完全态势信息,通过第二step接口,发送给当前博弈智能体;动作管理模块用于:根据从第一step接口获取到的动作信息生成动作信息对应的不完全态势信息。
-
公开(公告)号:CN113633994A
公开(公告)日:2021-11-12
申请号:CN202110808844.9
申请日:2021-07-16
Applicant: 中国科学院自动化研究所
IPC: A63F13/803 , A63F13/822 , G06N20/00 , H04L29/06
Abstract: 本发明提供一种人机智能博弈系统,所述系统包括:推演方决策模块,用于基于智能体框架模块传入的态势信息,确定动作集合;智能体框架模块,用于将推演房间模块发送的态势信息传入推演方决策模块,以使推演方决策模块生成动作集合,并将动作集合发送至推演房间模块;推演房间模块,用于将动作集合传入推演环境模块,以获取推演环境模块基于动作集合推演得到的态势信息,并将态势信息发送至智能体框架模块。本发明实现了对抗策略生成和智能体运行业务逻辑的解耦,使第三方开发者能够专注于博弈策略研发,同时符合标准的智能体能方便快捷地进行人机、机机对抗,实现了异构智能体的开放接入,显著减少整体故障概率,具有较好的鲁棒性。
-
公开(公告)号:CN112364500A
公开(公告)日:2021-02-12
申请号:CN202011239807.2
申请日:2020-11-09
Applicant: 中国科学院自动化研究所
Abstract: 本发明属于人工智能技术领域,具体涉及了一种面向强化学习训练与评估的多并发实时对抗系统,旨在解决现有对抗系统未使用内存训练模式,因而系统不适用于强化学习方法的训练和评估,从而对抗决策效果达不到预期的问题。本发明包括:对抗调度管理模块,根据对抗需求创建对抗场所、对抗进程和对抗想定参数;引擎内核模块,结合推演人员或AI行动集,更新推演状态和态势,生成实时推演的态势数据;推演用户端,将实时推演的态势数据解析为以地图格呈现的图形并展示以及获取推演人员或AI的操作指令并生成行动集;对抗观摩端,将实时推演的态势数据解析为3D模型和图形并展示以及在设定的视角切换展示。本发明对抗系统对抗决策效果好、应用广泛。
-
公开(公告)号:CN113633994B
公开(公告)日:2023-07-18
申请号:CN202110808844.9
申请日:2021-07-16
Applicant: 中国科学院自动化研究所
IPC: A63F13/803 , A63F13/822 , G06N20/00 , H04L67/01
Abstract: 本发明提供一种人机智能博弈系统,所述系统包括:推演方决策模块,用于基于智能体框架模块传入的态势信息,确定动作集合;智能体框架模块,用于将推演房间模块发送的态势信息传入推演方决策模块,以使推演方决策模块生成动作集合,并将动作集合发送至推演房间模块;推演房间模块,用于将动作集合传入推演环境模块,以获取推演环境模块基于动作集合推演得到的态势信息,并将态势信息发送至智能体框架模块。本发明实现了对抗策略生成和智能体运行业务逻辑的解耦,使第三方开发者能够专注于博弈策略研发,同时符合标准的智能体能方便快捷地进行人机、机机对抗,实现了异构智能体的开放接入,显著减少整体故障概率,具有较好的鲁棒性。
-
公开(公告)号:CN112364500B
公开(公告)日:2021-07-20
申请号:CN202011239807.2
申请日:2020-11-09
Applicant: 中国科学院自动化研究所
Abstract: 本发明属于人工智能技术领域,具体涉及了一种面向强化学习训练与评估的多并发实时对抗系统,旨在解决现有对抗系统未使用内存训练模式,因而系统不适用于强化学习方法的训练和评估,从而对抗决策效果达不到预期的问题。本发明包括:对抗调度管理模块,根据对抗需求创建对抗场所、对抗进程和对抗想定参数;引擎内核模块,结合推演人员或AI行动集,更新推演状态和态势,生成实时推演的态势数据;推演用户端,将实时推演的态势数据解析为以地图格呈现的图形并展示以及获取推演人员或AI的操作指令并生成行动集;对抗观摩端,将实时推演的态势数据解析为3D模型和图形并展示以及在设定的视角切换展示。本发明对抗系统对抗决策效果好、应用广泛。
-
-
-
-