一种基于RQL算法的选择拆卸规划方法及系统
摘要:
本发明提供一种基于RQL算法的选择拆卸规划方法及系统,获取待拆卸产品的数据集,结合Q‑learning算法和Rollout策略迭代采样待拆卸产品的数据集,得到待拆卸产品的优选拆卸序列,本申请的RQL(Rollout‑Q‑learning)算法是基于Rollout策略优化了Q‑learning算法在迭代过程中的动作选择,在每个决策阶段使用Rollout策略对每个可行动作进行有限步数的模拟采样之后,选择在有限步数内估计价值最大的可行动作,从而使Q‑learning算法具备更强的全局搜索能力,最终得到优选拆卸序列,相对于传统的Q‑learning算法,RQL(Rollout‑Q‑learning)算法在拆卸序列规划上有很大的性能提升,同时能够提高拆卸流程的回收效益,尽可能减少EoL产品对环境造成的危害。
公开/授权文献
0/0