一种基于近端策略优化的无人机轨迹设计和功率分配方法

    公开(公告)号:CN115494732B

    公开(公告)日:2024-04-12

    申请号:CN202211194735.3

    申请日:2022-09-29

    Applicant: 湖南大学

    Abstract: 本发明公开了一种基于近端策略优化的无人机轨迹设计和功率分配方法,包括获取当前环境状态;根据标准差以及预设的PPO算法网络中策略网络输出的均值构建服从高斯分布的随机变量,选择动作并保存动作选取概率,当动作超过预设的加速度上限时,作出相应调整;当执行更新后的动作违反约束条件时,则作出相应调整;各用户随机移动至新的位置,计算系统中断概率和当前无人机消耗的能量,进而获取奖励,将当前环境状态、动作、动作选取概率和奖励作为一组数据存入预设的缓冲区,当数据足够时,对算法网络进行训练并更新网络的参数;当无人机的能量耗尽时累加迭代次数,当迭代次数超过预设的迭代次数阈值,算法结束,完成无人机轨迹设计和功率分配。

    一种基于近端策略优化的网络切片资源分配方法

    公开(公告)号:CN116801314A

    公开(公告)日:2023-09-22

    申请号:CN202310744191.1

    申请日:2023-06-21

    Applicant: 湖南大学

    Abstract: 本发明公开了一种基于近端策略优化的网络切片资源分配方法,包括构建PPO算法网络;获取当前环境状态,输入到PPO算法网络中,构建服从高斯分布的随机变量,对该随机变量进行采样得到一个动作,并保存动作的选取概率;根据小区资源总数对动作的动作值进行映射为RB数量,当所有切片的RB数量总和小于小区资源块总数时,执行动作;更新环境状态,根据各切片状态以及资源占用情况获取即时奖励;将经验数据存储至经验池,当经验池中的数据达到存储阈值时,对PPO算法网络进行训练并更新网络参数;当当前的参数更新回合数到达预设的最大值以及在迭代周期内各切片状态需求全部在预设的指标范围内,完成网络切片资源分配。有效提升资源利用率及资源分配效率。

    一种基于近端策略优化的无人机轨迹设计和功率分配方法

    公开(公告)号:CN115494732A

    公开(公告)日:2022-12-20

    申请号:CN202211194735.3

    申请日:2022-09-29

    Applicant: 湖南大学

    Abstract: 本发明公开了一种基于近端策略优化的无人机轨迹设计和功率分配方法,包括获取当前环境状态;根据标准差以及预设的PPO算法网络中策略网络输出的均值构建服从高斯分布的随机变量,选择动作并保存动作选取概率,当动作超过预设的加速度上限时,作出相应调整;当执行更新后的动作违反约束条件时,则作出相应调整;各用户随机移动至新的位置,计算系统中断概率和当前无人机消耗的能量,进而获取奖励,将当前环境状态、动作、动作选取概率和奖励作为一组数据存入预设的缓冲区,当数据足够时,对算法网络进行训练并更新网络的参数;当无人机的能量耗尽时累加迭代次数,当迭代次数超过预设的迭代次数阈值,算法结束,完成无人机轨迹设计和功率分配。

Patent Agency Ranking