-
公开(公告)号:CN118195003A
公开(公告)日:2024-06-14
申请号:CN202410373848.2
申请日:2024-03-28
Applicant: 南京理工大学
Abstract: 本发明公开了一种结合时空图卷积的强化学习推理方法,属于知识图谱推理领域,包括以下步骤:S1、确定推理任务;S2、建立知识图谱环境;S3、智能体获取当前节点状态,卷积当前节点周围时空信息集合,作为策略网络的输入;S4、把S3获取的状态输入到策略网络中,获取动作概率函数,智能体从策略网络输出的动作概率函数中随机抽样,选择一个动作执行,与环境交互后获取奖励;S5、获取状态转移集合后,使用蒙特卡洛策略梯度更新网络参数。本发明采用上述的一种结合时空图卷积的强化学习推理方法,搭建时空图卷积网络获取当前节点在推理过程中的时空信息,进而提高智能体在当前节点的信息获取密度,提高路径推理活动的准确性。