一种知识迁移强化学习网络切片通感算资源协同优化方法

    公开(公告)号:CN114615744A

    公开(公告)日:2022-06-10

    申请号:CN202210185185.2

    申请日:2022-02-28

    Abstract: 本发明公布了一种知识迁移强化学习网络切片通感算资源协同优化方法,旨在针对移动边缘网络切片用户差异化服务需求,在考虑网络切片通感算资源、用户设备时延和能耗等约束限制基础上,以用户设备总吞吐量最大化为优化目标,建立网络切片通感算资源协同优化问题模型。在此基础上,将上述优化问题建模为多智能体随机博弈过程,研究多智能体间知识迁移强化学习算法,提升协同优化策略探索效率和可扩展性,实现多样化业务场景下网络切片通感算资源协同优化。

    一种电力物联网中基于深度强化学习的计算任务卸载方法

    公开(公告)号:CN114065963A

    公开(公告)日:2022-02-18

    申请号:CN202111297200.4

    申请日:2021-11-04

    Abstract: 本发明公布了一种电力物联网中基于深度强化学习的计算任务卸载方法,旨在通过联合优化无人机位置、发射功率和任务划分变量来最小化能耗和时延。首先,针对计算任务卸载问题的非凸性,通过设计状态、动作空间和奖励函数,制定了马尔可夫决策过程,奖励函数基于面向输电线路巡检的电力物联网系统模型,涉及采集设备、巡检无人机和边缘服务器之间的交互,对计算任务卸载问题进行描述。在此基础上,由于马尔可夫模型具有连续的动作空间,提出了双延迟深度确定性策略梯度算法,获得了任务卸载的最优策略。

Patent Agency Ranking