-
公开(公告)号:CN119129640A
公开(公告)日:2024-12-13
申请号:CN202411056914.X
申请日:2024-08-02
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06N3/008 , G06N3/0455 , G06N3/092
Abstract: 本发明公开了一种基于置换偏置与对比解码的智能体动作预测方法,所述方法包括:构建策略生成模型,包括Encoder模块和Decoder模块,获取局部观测向量和动作序列,将局部观测向量输入Encoder模块进行处理,得到智能体的观测表示,并将观测表示传递给Decoder模块,根据观测表示得到观测的智能体状态值函数;将动作序列输入到Decoder模块与观测表示一起进行解码,得到隐向量,将隐向量进行变换得到具有动作置换性的智能体动作集合,将具有动作置换性的智能体动作集合进行对比探索解码,得到执行动作,根据智能体状态值函数和执行动作计算总损失函数,得到目标模型,使用目标模型预测目标智能体的行为。本发明提高了对于目标智能体动作的预测精度。