-
公开(公告)号:CN106850289A
公开(公告)日:2017-06-13
申请号:CN201710055817.2
申请日:2017-01-25
Applicant: 东南大学
Abstract: 本发明公开了一种结合高斯过程与强化学习的服务组合方法,包括如下步骤:1、将服务组合问题建模为一个四元组马尔可夫决策过程;2、应用基于Q‑learning的强化学习方法求解四元组马尔可夫决策过程,得到最优策略;其中通过建立Q值高斯预测模型来对Q值进行更新;3、将最优策略映射为web服务组合的工作流。该方法使用高斯过程对Q值的学习进行建模,从而使其具有更好的精确性和泛化性。
-
公开(公告)号:CN106850289B
公开(公告)日:2020-04-24
申请号:CN201710055817.2
申请日:2017-01-25
Applicant: 东南大学
Abstract: 本发明公开了一种结合高斯过程与强化学习的服务组合方法,包括如下步骤:1、将服务组合问题建模为一个四元组马尔可夫决策过程;2、应用基于Q‑learning的强化学习方法求解四元组马尔可夫决策过程,得到最优策略;其中通过建立Q值高斯预测模型来对Q值进行更新;3、将最优策略映射为web服务组合的工作流。该方法使用高斯过程对Q值的学习进行建模,从而使其具有更好的精确性和泛化性。
-