-
公开(公告)号:CN119907048A
公开(公告)日:2025-04-29
申请号:CN202510113388.4
申请日:2025-01-24
Applicant: 东北大学
IPC: H04W28/08 , H04W84/06 , G06N3/044 , G06N3/0499 , G06N3/092
Abstract: 本发明属于空天地一体化网络技术领域,公开一种面向空天地一体化网络的无人机轨迹优化和任务卸载方法。旨在优化空天地一体化网络中的任务卸载效率,重点关注能耗和时延的优化,提出的方法综合考虑空天地一体化网络的各种情况,将解耦通信方式考虑其中,减小服务中断影响。构建优化模型,目的是最小化时延与能耗加权和。为提高空天地一体化网络中异构智能体的协同性,基于一种层次强化学习的框架,提出基于层次学习的双级Qmix算法,强化低轨卫星与无人机协同。经Pycharm平台仿真,多场景验证本发明在平均响应时延、能耗及QoS指标上优势显著,有效提升网络性能,满足用户需求。
-
公开(公告)号:CN117835329B
公开(公告)日:2024-07-05
申请号:CN202410241235.3
申请日:2024-03-04
Applicant: 东北大学
IPC: H04W28/084 , H04W4/029 , H04W4/48 , H04W4/44 , G06N3/0442 , G06N3/0455 , G06N3/096
Abstract: 本发明属于边缘计算应用技术领域,公开一种车载边缘计算中基于移动性预测的服务迁移方法。获取车辆位置数据,使用车辆移动性预测模型预测车辆位置;根据预测的车辆位置,使用预测误差估计模型进行预测误差估计,并根据估计的预测误差修正车辆位置预测结果;基于修正的车辆位置预测结果,通过服务迁移决策模型制定基于双策略蒸馏深度强化学习服务迁移策略。本发明可以减少服务迁移的中断时间。通过使用两个深度强化学习模型互相学习的方式,加快模型的学习速度,增强模型的探索能力,提升模型决策的效果。通过引入动作价值函数,让服务迁移策略的评价不再只依赖于状态价值函数,而是转换为动作价值函数与状态价值函数的比较,以提升蒸馏效率。
-
公开(公告)号:CN117688257B
公开(公告)日:2024-07-05
申请号:CN202410120177.9
申请日:2024-01-29
Applicant: 东北大学
IPC: G06F16/9537 , G06F18/23213 , G06F18/22 , G06N3/092
Abstract: 本发明属于智能交通技术领域,公开了一种面向异构用户行为模式的长期轨迹预测方法。度量轨迹中多个维度的相似性,构建可学习的距离权重矩阵,获得融合多维距离得分;构建邻接矩阵,进行轨迹聚类,聚类结果用于强化学习中优化可学习的距离权重矩阵中的参数;使用轨迹聚类每一个聚类簇中的轨迹数据训练轨迹预测模型,训练后的轨迹预测模型作为轨迹预测。本发明将具有相同行为模式的轨迹划分在一个类内差异较小的簇中,然后使用引入时间和速度信息编码的堆叠Transform结构来提取并融合多属性轨迹中的多维特征,并进一步产生长期轨迹预测结果。对于智能交通场景,面向异构用户行为模式的长期轨迹预测方法具有相当的适用价值。
-
公开(公告)号:CN117880858A
公开(公告)日:2024-04-12
申请号:CN202410275005.9
申请日:2024-03-12
Applicant: 东北大学
Abstract: 本发明属于机器人智能决策与控制技术领域,公开了一种基于通信学习的多无人机轨迹优化和功率控制方法,能够在较低能耗的情况下最大化满足服务质量的用户数量。本发明设计了一个通信机制,增设记忆存储设备以帮助UAV‑ABS获取和利用其他无人机的经验,并存储自身学习到的经验。为了构建更有效的无人机合作策略并降低网络模型部署的成本,本发明设计了集中注意力评论家神经网络,能够减少冗余信息,并解决随着UAV‑ABS和地面用户数量增加而出现的维度灾难问题。
-
公开(公告)号:CN119849662A
公开(公告)日:2025-04-18
申请号:CN202411931876.8
申请日:2024-12-25
Applicant: 大连七贤智远科技研究院有限公司 , 东北大学
Abstract: 本公开涉及一种模型训练方法、装置、存储介质及电子设备,该方法包括:在确定任一候选车辆完成对待训练模型的训练的情况下,确定该候选车辆针对待训练模型的第一加密模型切片,针对任一候选车辆,确定该候选车辆对应的第一模型差异,对各个候选车辆的第一加密模型切片进行聚合,得到与目标路侧单元对应的第一聚合模型切片,向服务器发送与各个候选车辆分别对应的第一模型差异和第一聚合模型切片,以使服务器确定模型参数满足预设参数差异条件的安全车辆,对安全车辆的第一加密模型切片进行聚合,得到第二聚合模型切片,向服务器发送第二聚合模型切片,以使服务器得到待训练模型的目标模型参数。采用该方法可以提高联邦学习得到的模型的安全性。
-
公开(公告)号:CN119967491A
公开(公告)日:2025-05-09
申请号:CN202510112942.7
申请日:2025-01-24
Applicant: 东北大学
IPC: H04W28/084 , H04W28/08 , H04W4/40 , G06N3/092
Abstract: 本发明属于车载边缘计算领域,公开及一种面向车载边缘计算环境的分布式服务迁移方法。该方法基于对比角色表示和多智能体深度强化学习,通过构建一个三层异构车载边缘网络模型,包括云中心层、边缘层和用户层,优化服务迁移决策。本发明提出了一种基于改进QMIX的多智能体深度强化学习方法,根据智能体历史轨迹信息为局部Q网络和混合网络构建智能体行为状态轨迹嵌入,捕捉时间相关的行为模式,解决部分可观测性问题,进一步使用基于对比学习的角色编码器提取不同智能体的独特行为模式生成角色表示,以捕获智能体行为的长期特征;在混合网络中引入多头注意力机制,动态分配注意力权重。本方法具有性能优越性。
-
公开(公告)号:CN119907049A
公开(公告)日:2025-04-29
申请号:CN202510114803.8
申请日:2025-01-24
Applicant: 东北大学
IPC: H04W28/08 , H04W28/084 , H04W84/06 , G06N3/092 , G06N3/0442 , G06N3/0499
Abstract: 本发明属于卫星边缘计算领域,公开一种卫星边缘计算中星地协同服务迁移方法。构建信息提取结构进行信息提取,得到关键时序信息;设计一种星地协同的服务迁移多智能体强化学习算法,关键时序信息作为星地协同的服务迁移多智能体强化学习算法中的观测值,强化学习得到最优服务迁移策略。本发明提出结合时间注意力机制和双向门控循环单元的信息提取方法,有效捕捉历史数据中的时序模式,提高服务迁移决策精度。结合地面基站与低轨卫星网络的协同优化,采用Actor‑Critic结构和全局Critic机制,优化跨网络服务迁移,降低迁移成本和服务中断时间,提升用户服务体验。本发明在奖励值、迁移成本和用户获取服务时延方面表现出显著优势。
-
公开(公告)号:CN117880858B
公开(公告)日:2024-05-10
申请号:CN202410275005.9
申请日:2024-03-12
Applicant: 东北大学
Abstract: 本发明属于机器人智能决策与控制技术领域,公开了一种基于通信学习的多无人机轨迹优化和功率控制方法,能够在较低能耗的情况下最大化满足服务质量的用户数量。本发明设计了一个通信机制,增设记忆存储设备以帮助UAV‑ABS获取和利用其他无人机的经验,并存储自身学习到的经验。为了构建更有效的无人机合作策略并降低网络模型部署的成本,本发明设计了集中注意力评论家神经网络,能够减少冗余信息,并解决随着UAV‑ABS和地面用户数量增加而出现的维度灾难问题。
-
公开(公告)号:CN117835329A
公开(公告)日:2024-04-05
申请号:CN202410241235.3
申请日:2024-03-04
Applicant: 东北大学
IPC: H04W28/084 , H04W4/029 , H04W4/48 , H04W4/44 , G06N3/0442 , G06N3/0455 , G06N3/096
Abstract: 本发明属于边缘计算应用技术领域,公开一种车载边缘计算中基于移动性预测的服务迁移方法。获取车辆位置数据,使用车辆移动性预测模型预测车辆位置;根据预测的车辆位置,使用预测误差估计模型进行预测误差估计,并根据估计的预测误差修正车辆位置预测结果;基于修正的车辆位置预测结果,通过服务迁移决策模型制定基于双策略蒸馏深度强化学习服务迁移策略。本发明可以减少服务迁移的中断时间。通过使用两个深度强化学习模型互相学习的方式,加快模型的学习速度,增强模型的探索能力,提升模型决策的效果。通过引入动作价值函数,让服务迁移策略的评价不再只依赖于状态价值函数,而是转换为动作价值函数与状态价值函数的比较,以提升蒸馏效率。
-
公开(公告)号:CN117688257A
公开(公告)日:2024-03-12
申请号:CN202410120177.9
申请日:2024-01-29
Applicant: 东北大学
IPC: G06F16/9537 , G06F18/23213 , G06F18/22 , G06N3/092
Abstract: 本发明属于智能交通技术领域,公开了一种面向异构用户行为模式的长期轨迹预测方法。度量轨迹中多个维度的相似性,构建可学习的距离权重矩阵,获得融合多维距离得分;构建邻接矩阵,进行轨迹聚类,聚类结果用于强化学习中优化可学习的距离权重矩阵中的参数;使用轨迹聚类每一个聚类簇中的轨迹数据训练轨迹预测模型,训练后的轨迹预测模型作为轨迹预测。本发明将具有相同行为模式的轨迹划分在一个类内差异较小的簇中,然后使用引入时间和速度信息编码的堆叠Transform结构来提取并融合多属性轨迹中的多维特征,并进一步产生长期轨迹预测结果。对于智能交通场景,面向异构用户行为模式的长期轨迹预测方法具有相当的适用价值。
-
-
-
-
-
-
-
-
-