基于迁移和强化学习的移动边缘计算系统任务调度方法

    公开(公告)号:CN111858009B

    公开(公告)日:2022-06-17

    申请号:CN202010748707.6

    申请日:2020-07-30

    Abstract: 本发明针对边缘计算服务器的任务调度问题,提出一种基于迁移和强化学习的移动边缘计算系统任务调度方法,首先为每个服务器构建一个Actor‑Critic网络来训练它的调度策略;其中,Actor网络通过自身状态来决定动作,而Critic网络则根据所有服务器的动作和状态来评价该动作的好坏。所有服务器共享一个Critic网络。在使用多智能体强化学习训练多个边缘服务器调度策略的时候,为每个服务器的调度策略构建相同结构的策略网络。这些策略网络不仅拥有相同的网络层,并且每层的节点数目也相同。使用集中训练分散执行的机制来训练这些策略,以此来避免因为服务器数目过多而引起的维数灾难问题。

    基于迁移和强化学习的移动边缘计算系统任务调度方法

    公开(公告)号:CN111858009A

    公开(公告)日:2020-10-30

    申请号:CN202010748707.6

    申请日:2020-07-30

    Abstract: 本发明针对边缘计算服务器的任务调度问题,提出一种基于迁移和强化学习的移动边缘计算系统任务调度方法,首先为每个服务器构建一个Actor-Critic网络来训练它的调度策略;其中,Actor网络通过自身状态来决定动作,而Critic网络则根据所有服务器的动作和状态来评价该动作的好坏。所有服务器共享一个Critic网络。在使用多智能体强化学习训练多个边缘服务器调度策略的时候,为每个服务器的调度策略构建相同结构的策略网络。这些策略网络不仅拥有相同的网络层,并且每层的节点数目也相同。使用集中训练分散执行的机制来训练这些策略,以此来避免因为服务器数目过多而引起的维数灾难问题。

    一种基于边缘计算的防震减灾救灾方法和系统

    公开(公告)号:CN111988397B

    公开(公告)日:2023-03-31

    申请号:CN202010837388.6

    申请日:2020-08-19

    Abstract: 本发明提出一种基于边缘计算的防震减灾救灾方法和系统,该系统包括用于获取所处场景的灾情数据的若干个终端节点;用于调度下属的终端节点以获取其上传数据、并根据上传数据作出损失评估计算和结果的若干个边缘侧节点;用于向指定的边缘侧节点发出烈度圈评估指令、并获取该些边缘侧节点反馈的评估结果以进行整体损失评估的云中心;该方法是云中心在接收到地震信息后进行烈度圈评估;随后向烈度圈覆盖范围内的边缘侧节点发出指令,让调度其下属的终端节点获取所处场景的灾情数据;边缘侧节点根据终端节点上传的数据进行损失评估计算以获得评估结果并上传至云中心;云中心根据GIS地图数据进行拼接,形成整体损失评估结果。

    基于合作式强化学习与迁移学习的多智能体对抗决策方法

    公开(公告)号:CN111695690B

    公开(公告)日:2023-04-18

    申请号:CN202010748266.X

    申请日:2020-07-30

    Abstract: 本发明提出一种基于合作式强化学习与迁移学习的多智能体对抗决策方法,其特征在于,包括如下步骤:定义智能体的状态空间S={s1,s2,…,sn};设定其动作空间Α={a1,a2,…,an};设定智能体强化学习模型的值函数矩阵;使用动作评估器计算当前状态st对应的值函数序列通过基于模拟退火与softmax策略的动作选择器选择相应的动作at;同时,智能体的状态发生变化,转移到下一状态st+1。在执行动作at后,智能体从环境中获得奖励信号rt;通过权重共享的方式可以降低经验存储的损耗,提高对抗决策效率。通过基于衰减函数的迁移学习方法使得智能体以逐渐递减的概率复用先前经验,迁移学习将先前训练得到的动作评估器权重迁移到更多的对抗决策场景,提高了学习模型的泛化性。

    一种基于边缘计算的防震减灾救灾方法和系统

    公开(公告)号:CN111988397A

    公开(公告)日:2020-11-24

    申请号:CN202010837388.6

    申请日:2020-08-19

    Abstract: 本发明提出一种基于边缘计算的防震减灾救灾方法和系统,该系统包括用于获取所处场景的灾情数据的若干个终端节点;用于调度下属的终端节点以获取其上传数据、并根据上传数据作出损失评估计算和结果的若干个边缘侧节点;用于向指定的边缘侧节点发出烈度圈评估指令、并获取该些边缘侧节点反馈的评估结果以进行整体损失评估的云中心;该方法是云中心在接收到地震信息后进行烈度圈评估;随后向烈度圈覆盖范围内的边缘侧节点发出指令,让调度其下属的终端节点获取所处场景的灾情数据;边缘侧节点根据终端节点上传的数据进行损失评估计算以获得评估结果并上传至云中心;云中心根据GIS地图数据进行拼接,形成整体损失评估结果。

    基于合作式强化学习与迁移学习的多智能体对抗决策方法

    公开(公告)号:CN111695690A

    公开(公告)日:2020-09-22

    申请号:CN202010748266.X

    申请日:2020-07-30

    Abstract: 本发明提出一种基于合作式强化学习与迁移学习的多智能体对抗决策方法,其特征在于,包括如下步骤:定义智能体的状态空间S={s1,s2,...,sn};设定其动作空间Α={a1,a2,...,an};设定智能体强化学习模型的值函数矩阵;使用动作评估器计算当前状态st对应的值函数序列通过基于模拟退火与softmax策略的动作选择器选择相应的动作at;同时,智能体的状态发生变化,转移到下一状态st+1。在执行动作at后,智能体从环境中获得奖励信号rt;通过权重共享的方式可以降低经验存储的损耗,提高对抗决策效率。通过基于衰减函数的迁移学习方法使得智能体以逐渐递减的概率复用先前经验,迁移学习将先前训练得到的动作评估器权重迁移到更多的对抗决策场景,提高了学习模型的泛化性。

Patent Agency Ranking