结合高斯过程与强化学习的服务组合方法

    公开(公告)号:CN106850289A

    公开(公告)日:2017-06-13

    申请号:CN201710055817.2

    申请日:2017-01-25

    Applicant: 东南大学

    Inventor: 王红兵 李佳杰

    Abstract: 本发明公开了一种结合高斯过程与强化学习的服务组合方法,包括如下步骤:1、将服务组合问题建模为一个四元组马尔可夫决策过程;2、应用基于Q‑learning的强化学习方法求解四元组马尔可夫决策过程,得到最优策略;其中通过建立Q值高斯预测模型来对Q值进行更新;3、将最优策略映射为web服务组合的工作流。该方法使用高斯过程对Q值的学习进行建模,从而使其具有更好的精确性和泛化性。

    结合高斯过程与强化学习的服务组合方法

    公开(公告)号:CN106850289B

    公开(公告)日:2020-04-24

    申请号:CN201710055817.2

    申请日:2017-01-25

    Applicant: 东南大学

    Inventor: 王红兵 李佳杰

    Abstract: 本发明公开了一种结合高斯过程与强化学习的服务组合方法,包括如下步骤:1、将服务组合问题建模为一个四元组马尔可夫决策过程;2、应用基于Q‑learning的强化学习方法求解四元组马尔可夫决策过程,得到最优策略;其中通过建立Q值高斯预测模型来对Q值进行更新;3、将最优策略映射为web服务组合的工作流。该方法使用高斯过程对Q值的学习进行建模,从而使其具有更好的精确性和泛化性。

Patent Agency Ranking