-
公开(公告)号:CN118045360B
公开(公告)日:2024-11-29
申请号:CN202410302417.7
申请日:2024-03-15
Applicant: 中国科学院自动化研究所
IPC: A63F13/60 , G06N3/0464 , G06N3/092
Abstract: 本公开提供了一种兵棋智能体的训练方法、预测方法及相应系统。所述兵棋智能体的训练方法包括:基于兵棋对抗环境,生成专家示范数据集;基于所述专家示范数据集,对所述兵棋智能体中的用于为我方各算子选择机动方位的多任务网络进行模仿学习训练,以得到初步训练好的多任务网络;基于所述兵棋对抗环境,对初步训练好的多任务网络进行强化学习训练,得到优化后的多任务网络;其中,所述专家示范数据集包括:所述多任务网络决策所需的态势特征、我方的N个算子的机动方位标签,N为大于1的整数。根据本公开,能够实现具有更高性能的兵棋智能体的高效获取。
-
公开(公告)号:CN115933889A
公开(公告)日:2023-04-07
申请号:CN202310183032.9
申请日:2023-03-01
Applicant: 中国科学院自动化研究所
Abstract: 本申请实施例涉及一种支持心理临场感操控的人机博弈系统和人机博弈方法,涉及人机博弈领域。该系统包括:人机博弈模块,用于实现人机博弈;行为数据采集模块,用于获取人类对抗者在博弈中的第一动作生理数据和博弈行为数据;行为数据处理模块,用于基于博弈行为数据库确定与所述第一动作生理数据和博弈行为数据相对应的人类对抗者的第一心理状态;心理操控知识库模块,用于基于心理操控知识库确定与所述第一心理状态和心理操控目的相对应的第一心理操控方案;心理操控干预模块,用于执行所述第一心理操控方案,该系统能够观测博弈者心理状态,并对博弈者实施心理操纵与干预,构建更逼近真实的博弈环境。
-
公开(公告)号:CN118045360A
公开(公告)日:2024-05-17
申请号:CN202410302417.7
申请日:2024-03-15
Applicant: 中国科学院自动化研究所
IPC: A63F13/60 , G06N3/0464 , G06N3/092
Abstract: 本公开提供了一种兵棋智能体的训练方法、预测方法及相应系统。所述兵棋智能体的训练方法包括:基于兵棋对抗环境,生成专家示范数据集;基于所述专家示范数据集,对所述兵棋智能体中的用于为我方各算子选择机动方位的多任务网络进行模仿学习训练,以得到初步训练好的多任务网络;基于所述兵棋对抗环境,对初步训练好的多任务网络进行强化学习训练,得到优化后的多任务网络;其中,所述专家示范数据集包括:所述多任务网络决策所需的态势特征、我方的N个算子的机动方位标签,N为大于1的整数。根据本公开,能够实现具有更高性能的兵棋智能体的高效获取。
-
公开(公告)号:CN115933889B
公开(公告)日:2023-11-03
申请号:CN202310183032.9
申请日:2023-03-01
Applicant: 中国科学院自动化研究所
Abstract: 本申请实施例涉及一种支持心理临场感操控的人机博弈系统和人机博弈方法,涉及人机博弈领域。该系统包括:人机博弈模块,用于实现人机博弈;行为数据采集模块,用于获取人类对抗者在博弈中的第一动作生理数据和博弈行为数据;行为数据处理模块,用于基于博弈行为数据库确定与所述第一动作生理数据和博弈行为数据相对应的人类对抗者的第一心理状态;心理操控知识库模块,用于基于心理操控知识库确定与所述第一心理状态和心理操控目的相对应的第一心理操控方案;心理操控干预模块,用于执行所述第一心理操控方案,该系统能够观测博弈者心理状态,并对博弈者实施心理操纵与干预,构建更逼近真实的博弈环境。
-
-
-