一种基于混合动作空间强化学习算法的计算卸载方法

    公开(公告)号:CN114205353B

    公开(公告)日:2023-08-01

    申请号:CN202111424091.8

    申请日:2021-11-26

    Inventor: 杨钊 王廷 蔡海滨

    Abstract: 本发明公开了一种基于混合动作空间强化学习算法的计算卸载方法,该方法包括步骤:a)在多设备多服务器的应用场景下建立任务协作卸载与资源分配模型;b)获取请求任务的状态;c)获得学习模型和d)求解卸载决策;通过将卸载过程中的决策划分为具有离散行为选择和连续行为决策的混合动作空间,并且通过为离散行为和连续行为分别制定不同的决策策略,取得更有效的优化效果。本发明基于处理具有混合动作空间的深度强化学习算法,将移动设备的任务完成时延和能量消耗作为优化目标,与其他算法相比本发明提出的方法相比可有效降低移动用户时延和能耗,提升用户体验质量。

    一种基于元强化学习算法的计算卸载方法

    公开(公告)号:CN114860337A

    公开(公告)日:2022-08-05

    申请号:CN202210534342.6

    申请日:2022-05-17

    Inventor: 杨钊 王廷 蔡海滨

    Abstract: 本发明公开了一种基于元强化学习算法的计算卸载方法,其特点是该方法采用在物联网设备、边缘服务器和云服务器协作式应用场景下建立任务卸载决策和资源分配模型,获取当前卸载系统的状态,然后通过元学习获取学习模型,最后通过训练获取任务卸载决策。本发明与现有技术相比具有降低物联网设备计算任务的时延和功耗,从而提升用户体验,有效解决了传统的深度强化学习算法对新任务采样效率低的问题,实现在动态环境中的快速计算卸载决策。

    一种基于元强化学习算法的计算卸载方法

    公开(公告)号:CN114860337B

    公开(公告)日:2023-07-25

    申请号:CN202210534342.6

    申请日:2022-05-17

    Inventor: 杨钊 王廷 蔡海滨

    Abstract: 本发明公开了一种基于元强化学习算法的计算卸载方法,其特点是该方法采用在物联网设备、边缘服务器和云服务器协作式应用场景下建立任务卸载决策和资源分配模型,获取当前卸载系统的状态,然后通过元学习获取学习模型,最后通过训练获取任务卸载决策。本发明与现有技术相比具有降低物联网设备计算任务的时延和功耗,从而提升用户体验,有效解决了传统的深度强化学习算法对新任务采样效率低的问题,实现在动态环境中的快速计算卸载决策。

    一种基于混合动作空间强化学习算法的计算卸载方法

    公开(公告)号:CN114205353A

    公开(公告)日:2022-03-18

    申请号:CN202111424091.8

    申请日:2021-11-26

    Inventor: 杨钊 王廷 蔡海滨

    Abstract: 本发明公开了一种基于混合动作空间强化学习算法的计算卸载方法,该方法包括步骤:a)在多设备多服务器的应用场景下建立任务协作卸载与资源分配模型;b)获取请求任务的状态;c)获得学习模型和d)求解卸载决策;通过将卸载过程中的决策划分为具有离散行为选择和连续行为决策的混合动作空间,并且通过为离散行为和连续行为分别制定不同的决策策略,取得更有效的优化效果。本发明基于处理具有混合动作空间的深度强化学习算法,将移动设备的任务完成时延和能量消耗作为优化目标,与其他算法相比本发明提出的方法相比可有效降低移动用户时延和能耗,提升用户体验质量。

Patent Agency Ranking