-
公开(公告)号:CN116738010A
公开(公告)日:2023-09-12
申请号:CN202311001415.6
申请日:2023-08-10
Applicant: 北京科技大学
IPC: G06F16/901 , G06N7/01 , G06N5/025 , G06N3/092 , G06N5/04
Abstract: 本发明公开了一种基于因果强化学习的图节点遍历问题求解方法,属于数据处理领域,包括以下步骤:S1、将图节点遍历问题抽象为因果强化学习的目标空间;S2、定义图节点遍历问题的优化目标、状态空间、动作空间、策略、奖励函数和奖励期望;S3、智能体从已完成建模的因果强化学习环境中学习图节点遍历问题求解方法。本发明采用上述基于因果强化学习的图节点遍历问题求解方法,在结合因果推断与强化学习,以实现对复杂图节点遍历问题的高效解决的基础上,不仅能提高模型的可解释性,理解模型的决策过程,还能够显著提高模型在处理大规模和复杂图节点遍历问题上的性能,节省计算资源,提高计算效率。