一种基于深度强化学习的能量效率无人机资源调度方法

    公开(公告)号:CN117993475A

    公开(公告)日:2024-05-07

    申请号:CN202410310272.5

    申请日:2024-03-19

    Abstract: 本发明属于通信技术领域,特别涉及一种基于深度强化学习的能量效率无人机资源调度方法,包括设置在无人机上的传感器实时采集风速和空气密度数据,对采集的数据进行预处理;将预处理的数据输入预训练的GRU网络进行特征提取,对提取的特征与无人机观测信息拼接在一起作为无人机状态;将无人机状态输入智能体,智能体为无人机选择最佳资源调度策略;本发明一方面通过机载设备采集风速与空气密度信息等多模态数据,结合注意力机制,赋予无人机代理观测状态中各个分量不同的权重来突出重要且关键的信息,实现对周边飞行环境的预测,另一方面通过深度强化学习代理和历史数据的交互来学习数据中的关键信息,在每一个时间步中,代理能够更加关注有价值的环境状态,从而简化动作空间,将无人机飞行的连续动作与功率、频谱分配的离散动作合并作为混合动作空间,联合选取最佳动作,在保证服务质量的前提下最小化无人机功耗。

Patent Agency Ranking