一种基于RQL算法的选择拆卸规划方法及系统

    公开(公告)号:CN117151425B

    公开(公告)日:2024-04-26

    申请号:CN202311364387.4

    申请日:2023-10-20

    Applicant: 暨南大学

    Abstract: 本发明提供一种基于RQL算法的选择拆卸规划方法及系统,获取待拆卸产品的数据集,结合Q‑learning算法和Rollout策略迭代采样待拆卸产品的数据集,得到待拆卸产品的优选拆卸序列,本申请的RQL(Rollout‑Q‑learning)算法是基于Rollout策略优化了Q‑learning算法在迭代过程中的动作选择,在每个决策阶段使用Rollout策略对每个可行动作进行有限步数的模拟采样之后,选择在有限步数内估计价值最大的可行动作,从而使Q‑learning算法具备更强的全局搜索能力,最终得到优选拆卸序列,相对于传统的Q‑learning算法,RQL(Rollout‑Q‑learning)算法在拆卸序列规划上有很大的性能提升,同时能够提高拆卸流程的回收效益,尽可能减少EoL产品对环境造成的危害。

    一种基于RQL算法的选择拆卸规划方法及系统

    公开(公告)号:CN117151425A

    公开(公告)日:2023-12-01

    申请号:CN202311364387.4

    申请日:2023-10-20

    Applicant: 暨南大学

    Abstract: 本发明提供一种基于RQL算法的选择拆卸规划方法及系统,获取待拆卸产品的数据集,结合Q‑learning算法和Rollout策略迭代采样待拆卸产品的数据集,得到待拆卸产品的优选拆卸序列,本申请的RQL(Rollout‑Q‑learning)算法是基于Rollout策略优化了Q‑learning算法在迭代过程中的动作选择,在每个决策阶段使用Rollout策略对每个可行动作进行有限步数的模拟采样之后,选择在有限步数内估计价值最大的可行动作,从而使Q‑learning算法具备更强的全局搜索能力,最终得到优选拆卸序列,相对于传统的Q‑learning算法,RQL(Rollout‑Q‑learning)算法在拆卸序列规划上有很大的性能提升,同时能够提高拆卸流程的回收效益,尽可能减少EoL产品对环境造成的危害。

Patent Agency Ranking