一种用于无人机轨迹优化的安全强化学习方法及系统

    公开(公告)号:CN117610639A

    公开(公告)日:2024-02-27

    申请号:CN202311143860.6

    申请日:2023-09-06

    Abstract: 本发明属于无线通信技术领域,公开了一种用于无人机轨迹优化的安全强化学习方法及系统,设计并明确网络场景、无人机的信道模型和能耗模型;构建优化目标,明确最小化平均信息年龄以及限制条件;根据场景及约束条件将问题转化为约束马尔科夫决策问题,进行状态空间、动作空间建模,并针对优化目标设计奖励函数;基于STD3算法构建无人机轨迹优化算法,对模型训练,并将训练好的模型在与不同用户参数下与基准算法对比进行性能验证。本发明能够有效地解决无人机飞行轨迹规划问题,提高数据收集的质量和速度,降低运行成本和风险。能够适应复杂和动态变化的环境,实现无人机的自主飞行和智能决策,提高无人机的安全性和可靠性。

    无线网络中面向多播传输场景的状态更新调度方法及系统

    公开(公告)号:CN116546441A

    公开(公告)日:2023-08-04

    申请号:CN202310404347.1

    申请日:2023-04-17

    Abstract: 本发明属于无线通信技术领域,公开了一种无线网络中面向多播传输场景的状态更新调度方法及系统,收集并处理多播场景中的几何环境信息,并确定停止集来表示发射节点周围的有限观测区域;根据发射节点的本地信息,将发射节点的调度概率表示为停止集的函数,确保调度概率是接受本地信息的产生新信息包概率的可测量函数;使用最优化理论求解多播场景下平均网络信息年龄最小化优化问题,得到发射节点处的状态更新调度方法;对多播场景中各发射节点实施自适应调度策略,在网络运行过程中实时监测网络环境是否变化。本发明根据节点状态更新和网络拓扑动态调整传输策略,能够实现更高效、实时且低延迟的多播通信,为智能系统提供更可靠的数据传输基础。

    车联网中基于DDPG的ARIS辅助车联边缘计算方法与系统

    公开(公告)号:CN118843087A

    公开(公告)日:2024-10-25

    申请号:CN202410915991.X

    申请日:2024-07-09

    Abstract: 本发明属于无线通信技术领域,公开了一种车联网中基于DDPG的ARIS辅助车联边缘计算方法与系统,本发明引入配备可重构智能表面(RIS)的无人飞行器(UAV)作为空中RIS(Aerial RIS,ARIS)的概念,即将RIS和UAV整合为新型高效的VEC网络辅助设备,并利用无人飞行器的灵活性和RIS的低成本特性,克服通信性能和成本限制,协助车辆进行计算卸载。本发明提出了一种基于深度确定性策略梯度(DDPG)算法设计的空中智能超表面辅助车联边缘计算的算法,通过联合优化UAV的轨迹和RIS的相移,形成被动波束赋形,从而最大限度地提高车载计算任务的完成率。大量数值结果表明,基于DDPG的ARIS辅助VEC网络方案优于其他算法,任务完成率最多可提高26%。

    一种物联网中基于QMIX的多无人机协同数据收集方法与系统

    公开(公告)号:CN117156463A

    公开(公告)日:2023-12-01

    申请号:CN202310941811.0

    申请日:2023-07-28

    Abstract: 本发明属于无线通信技术领域,公开了一种物联网中基于QMIX的多无人机协同数据收集方法与系统,设计并明确网络场景、无人机的信道模型和能耗模型;构建优化目标,明确最小化用时最久无人机任务用时以及限制条件;根据场景及约束条件将问题转化为部分可观测的马尔科夫决策问题,进行状态空间、动作空间建模,并针对优化目标设计奖励函数;基于QMIX算法构建多无人机航迹规划算法,对模型训练,并将训练好的模型在与不同用户参数下与基准算法对比进行性能验证。本发明使用深度强化学习方法可得到一个最小化任务用时的次优解,降低其使用传统算法建模的复杂度,提高寻优效率,为多无人机协同数据收集提供更高效的求解算法。

    基于AC-GAN和动态概率调度的可靠联邦学习方法及系统

    公开(公告)号:CN119167226A

    公开(公告)日:2024-12-20

    申请号:CN202411181396.4

    申请日:2024-08-27

    Abstract: 本发明属于无线通信技术领域,公开了一种基于AC‑GAN和动态概率调度的可靠联邦学习方法及系统,可以抵御标签噪声、非独立同分布数据和中毒攻击对全局模型性能的消极影响,包括两个阶段:数据预处理阶段,服务器在小基准数据集上训练一个AC‑GAN模型并部署在用户端,用户借助AC‑GAN模型实施数据清洗和数据增强,从而实现噪声标签矫正同时缓解非独立同分布数据的影响;攻击检测阶段,参数服务器构建用户选择概率模型,基于动态概率调度策略过滤恶意用户。为防止用户模型信息泄露和半诚实的服务器推测用户信息,利用CKKS同态加密方案对模型参数进行加密,并采用双服务器架构。本发明克服了标签噪声、非独立同分布数据和中毒攻击对模型性能的影响。

    非独立同分布场景下应对恶意攻击的联邦学习方法及系统

    公开(公告)号:CN119150283A

    公开(公告)日:2024-12-17

    申请号:CN202411000149.X

    申请日:2024-07-24

    Abstract: 本发明属于人工智能技术领域,公开了一种非独立同分布场景下应对恶意攻击的联邦学习方法及系统,设计了一个基于边际贡献的用户贡献度模型和一个基于秩和比的用户可信度模型。本发明采用进化聚类的概念,利用本轮各用户的贡献度和前一轮计算的用户可信度来计算本轮所有用户的评分,并在此基础上利用贪心算法的思想选择参与聚合的用户逐个加入用户聚合模型的集合。同时,本发明将在服务器端维护一个根数据集,并将利用根数据集训练的服务器模型作为每轮的初始聚合模型。在非独立同分布场景下,本发明在两个具有不同比例恶意用户的公共数据集上评估了本算法的性能。大量的实验结果表明,本发明的算法在测试集上的准确度优于各种基线算法。

    恶意和低质量用户场景下安全无线联邦学习方法及系统

    公开(公告)号:CN117082496A

    公开(公告)日:2023-11-17

    申请号:CN202310828859.0

    申请日:2023-07-07

    Abstract: 本发明属于无线通信技术领域,公开了一种恶意和低质量用户场景下安全无线联邦学习方法及系统,可以抵御恶意用户和低质量用户对全局模型性能的消极影响,包括四个阶段:鉴别阶段,通过比较用户的模型与全局模型的余弦相似性,对用户的信用进行评估;重标签阶段:利用全局模型的预测结果对低质量用户本地数据集进行数据清洗;二次鉴别阶段:对第一次鉴别阶段筛选出的恶意用户集进行第二轮信用评估,筛选其中的低质量用户;常规训练阶段,调度良性用户进行全局模型聚合。为防止用户模型信息泄露和半诚实的服务器推测用户信息,利用同态加密技术对模型参数进行加密,并采用双服务器架构。本发明克服了低质量用户和恶意用户对模型性能的影响。

Patent Agency Ranking