-
公开(公告)号:CN112926729A
公开(公告)日:2021-06-08
申请号:CN202110488990.8
申请日:2021-05-06
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供通用的人机对抗智能体策略制定方法,包括:获取多智能体博弈仿真环境中各个智能体当前帧的状态信息、当前帧的地图信息;采用全连接神经网络处理各个智能体的状态信息,卷积神经网络处理各个智能体的地图信息,串接上述处理过的信息与智能体的编码信息送入长短时记忆网络并输出智能体的动作,上述网络参数构成了智能体决策的策略网络参数;采用全连接神经网络处理各个智能体的状态信息,卷积神经网络处理各个智能体的地图信息,串接上述处理过的信息与智能体的编码信息送入长短时记忆网络并输出智能体的值估计,上述网络参数构成了智能体值网络参数;应用所述智能体的值估计构成损失函数,采用策略梯度下降算法进行策略网络参数更新。
-
公开(公告)号:CN108647374B
公开(公告)日:2020-11-17
申请号:CN201810238441.3
申请日:2018-03-22
Applicant: 中国科学院自动化研究所
IPC: G06F30/20
Abstract: 本发明涉及陆军战术兵棋博弈领域,具体涉及一种陆军战术兵棋博弈中坦克战术行为模拟方法及系统和设备,旨在提高模拟系统在复杂多变环境下的速度。本发明的坦克战术行为模拟方法包括:接收我方棋子位置、敌方棋子位置,以及棋子在战场任意位置点的攻击区域、被攻击区域和机动区域等当前的态势信息;根据当前的态势信息确定模拟系统中我方坦克的初始位置并选择初始攻击目标;根据初始攻击目标将我方坦克机动到攻击位置;选择我方坦克在当前位置的攻击目标;对当前位置的攻击目标进行射击;计算当前位置点对应的撤退位置;将我方坦克撤退到当前位置点对应的撤退位置。使坦克能够在复杂、高动态及不确定的博弈回合内快速、合理地执行战术行为动作。
-
公开(公告)号:CN105512316B
公开(公告)日:2018-12-21
申请号:CN201510937756.3
申请日:2015-12-15
Applicant: 中国科学院自动化研究所
IPC: G06F17/30
Abstract: 本发明公开了一种结合移动终端的知识服务系统,包括云服务引擎和移动终端。云服务引擎包括:知识获取模块、知识搜索模块、知识推荐模块、知识推理模块、可视化处理模块、图像识别模块、知识数据库、以及图像特征库,上述各模块和库部署在一台服务器中,或分布部署于能够通过高速网络相互访问的多台服务器中。移动终端包括:图像获取模块、图像特征提取模块、以及用户界面模块。本发明还提供了一种基于该知识服务系统的知识服务方法。
-
公开(公告)号:CN113902355B
公开(公告)日:2022-04-05
申请号:CN202111482468.5
申请日:2021-12-07
Applicant: 中国科学院自动化研究所
Abstract: 本发明提出一种人机对抗能力评估评测方法和系统。其中,方法包括:根据对手信息和初始环境信息,构建评测对象的人机对抗能力模型;根据人机对抗能力模型生成人机对抗能力分级对抗环境;设置评测对象的各个能力等级评估评测的通过指标;根据所述通过指标,计算评测对象能力等级。本发明公开的上述方法围绕人机对抗的三要素,即“人”(对手识别)要素、“机”(行为建模)要素和“物”(空间认知)要素构建能力表征模型,形成了形式化的能力评估评测方法,为智能体能力发展方向提供了任务环境生成依据。
-
公开(公告)号:CN113779347B
公开(公告)日:2022-04-01
申请号:CN202111338899.4
申请日:2021-11-12
Applicant: 中国科学院自动化研究所
IPC: G06F16/909 , G06F7/58
Abstract: 本发明提供人机对抗临机环境生成方法、装置、存储介质及设备,包括:根据对抗地图、候选行动单元及候选要点地形,生成临机行动单元和临机要点地形;所述生成临机行动单元包括:生成行动单元临机位置和生成行动单元临机时间,具体包括:根据对抗双方所有候选行动单元的横纵坐标平均值,得到行动单元临机位置;根据对抗双方所有候选行动单元是否在对抗开始前改变位置,计算生成行动单元临机时间;所述生成临机要点地形包括:选择要点地形和生成要点地形临机时间;根据对抗双方行动单元临机位置,选择要点地形;根据要点地形是否在对抗开始前出现,计算要点地形临机时间。为智能体临机应变能力的评估和训练提供了有效验证环境。
-
公开(公告)号:CN112990460B
公开(公告)日:2021-08-17
申请号:CN202110489058.7
申请日:2021-05-06
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供通用的人机对抗分布式训练系统和方法,包括:控制端、训练端、数据生成端、环境推演端、数据存储端以及模型存储端;控制端负责启动训练、对手模型选择、终止训练;训练端负责基于强化学习算法进行决策网络的训练和参数更新,并将训练更新的参数传递给所述数据生成端和将待保存的参数传递给模型存储端;数据生成端负责从训练端和模型存储端提取决策网络参数,提取状态特征,并基于决策网络的参数生成动作;数据生成端负责将训练数据传递给数据存储端和接收数据生成端传递的动作进行仿真环境推演;数据存储端负责保存数据和将数据传递给训练端;模型存储端负责保存决策网络参数,构成模型集合和将决策网络参数传递给数据生成端。
-
公开(公告)号:CN112990460A
公开(公告)日:2021-06-18
申请号:CN202110489058.7
申请日:2021-05-06
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供通用的人机对抗分布式训练系统和方法,包括:控制端、训练端、数据生成端、环境推演端、数据存储端以及模型存储端;控制端负责启动训练、对手模型选择、终止训练;训练端负责基于强化学习算法进行决策网络的训练和参数更新,并将训练更新的参数传递给所述数据生成端和将待保存的参数传递给模型存储端;数据生成端负责从训练端和模型存储端提取决策网络参数,提取状态特征,并基于决策网络的参数生成动作;数据生成端负责将训练数据传递给数据存储端和接收数据生成端传递的动作进行仿真环境推演;数据存储端负责保存数据和将数据传递给训练端;模型存储端负责保存决策网络参数,构成模型集合和将决策网络参数传递给数据生成端。
-
公开(公告)号:CN108647374A
公开(公告)日:2018-10-12
申请号:CN201810238441.3
申请日:2018-03-22
Applicant: 中国科学院自动化研究所
IPC: G06F17/50
Abstract: 本发明涉及陆军战术兵棋博弈领域,具体涉及一种陆军战术兵棋博弈中坦克战术行为模拟方法及系统和设备,旨在提高模拟系统在复杂多变环境下的速度。本发明的坦克战术行为模拟方法包括:接收我方棋子位置、敌方棋子位置,以及棋子在战场任意位置点的攻击区域、被攻击区域和机动区域等当前的态势信息;根据当前的态势信息确定模拟系统中我方坦克的初始位置并选择初始攻击目标;根据初始攻击目标将我方坦克机动到攻击位置;选择我方坦克在当前位置的攻击目标;对当前位置的攻击目标进行射击;计算当前位置点对应的撤退位置;将我方坦克撤退到当前位置点对应的撤退位置。使坦克能够在复杂、高动态及不确定的博弈回合内快速、合理地执行战术行为动作。
-
公开(公告)号:CN104484411B
公开(公告)日:2017-12-22
申请号:CN201410783884.2
申请日:2014-12-16
Applicant: 中国科学院自动化研究所
IPC: G06F17/30
Abstract: 本发明公开了一种基于词典的语义知识库的构建方法,包括:构建基于词典语义知识表示模型的知识数据库;根据语义知识提取规则提取义项释义的语义知识;实现提取语义知识的义项映射;提取义项剩余释义的语义知识。本发明的方法能够灵活、快速地从词典中构建包含丰富语义的知识库,且知识库中所表示的知识具有通用性和权威性。本发明同时为自然语言的语义信息处理提供了一种深层语义知识的表示方法和语义相似度的计算方法,在自然语言处理领域具有广泛的应用价值,如在信息检索领域,能够实现基于语义而非关键词的检索,从而得到更贴近用户需求的深层语义检索结果。
-
公开(公告)号:CN103116657B
公开(公告)日:2015-12-02
申请号:CN201310076867.0
申请日:2013-03-11
Applicant: 中国科学院自动化研究所
IPC: G06F17/30
Abstract: 本发明公开了一种基于知识的面向教学任务的网络教学资源搜索方法。所述方法首先通过预处理阶段完成对教学资源搜索列表的离线整理和存储,然后在实时搜索阶段通过调取和即时处理离线资源搜索列表为教师用户的在线教学任务提供实时资源个性化搜索服务。本发明公开的上述方法结合了教学任务的知识描述和教师用户的行为特征,具有强大的语义特性、良好的资源查询扩展能力、并且实现查询扩展深度的可控,体现出了特色和创新。使用本发明提供的方法,能够针对教师正在进行的教学任务,从海量的网络教学资源中为其准确搜索并推送出与此教学任务密切相关的内容,为教师完成教学设计、备课等教学任务提供方便,同时也让网络上的教学资源得到充分的利用。
-
-
-
-
-
-
-
-
-