Patent search ap:("中国科学院计算技术研究所") AND inv:"何晨涛" Page 1

1.

发明公开
基于深度强化学习的无人系统网络自适应路由方法和系统有权转让

公开(公告)号：CN112202848A

公开(公告)日：2021-01-08

申请号：CN202010968137.1

申请日：2020-09-15

Applicant: 中国科学院计算技术研究所

Inventor： 刘建敏 , 王琪 , 徐勇军 , 何晨涛 , 徐亦达

IPC: H04L29/08 , H04L12/721 , H04L12/727 , H04L12/729

Abstract: 本发明提出一种基于深度强化学习的无人系统网络自适应路由方法，旨在解决现有技术中节点的高速移动、频繁变化的网络拓扑，无法提供自适应路由策略的技术问题。所述方法包括：所有节点以一个自适应的时间间隔发送HELLO信息包；任一节点收到其邻居节点发送的HELLO信息包后，更新该节点的邻居表中该邻居节点的节点信息；建立基于深度强化学习的路由策略算法框架；设计基于深度强化学习的路由策略实现方法。本发明具备良好的模型泛化能力，能泛化于具有不同网络规模和不同节点移动速度的网络上，使得本发明更适用于具有动态变化的无人系统网络。

2.

发明授权
基于深度强化学习的无人系统网络自适应路由方法和系统有权转让

公开(公告)号：CN112202848B

公开(公告)日：2021-11-30

申请号：CN202010968137.1

申请日：2020-09-15

Applicant: 中国科学院计算技术研究所

Inventor： 刘建敏 , 王琪 , 徐勇军 , 何晨涛 , 徐亦达

IPC: H04L29/08 , H04L12/721 , H04L12/727 , H04L12/729

Abstract: 本发明提出一种基于深度强化学习的无人系统网络自适应路由方法，旨在解决现有技术中节点的高速移动、频繁变化的网络拓扑，无法提供自适应路由策略的技术问题。所述方法包括：所有节点以一个自适应的时间间隔发送HELLO信息包；任一节点收到其邻居节点发送的HELLO信息包后，更新该节点的邻居表中该邻居节点的节点信息；建立基于深度强化学习的路由策略算法框架；设计基于深度强化学习的路由策略实现方法。本发明具备良好的模型泛化能力，能泛化于具有不同网络规模和不同节点移动速度的网络上，使得本发明更适用于具有动态变化的无人系统网络。

3.

发明授权
基于深度强化学习的实时分布式无线网络调度方法和系统有权

公开(公告)号：CN114173418B

公开(公告)日：2025-04-04

申请号：CN202111327838.8

申请日：2021-11-10

Applicant: 中国科学院计算技术研究所

Inventor： 王琪 , 何晨涛 , 黄建辉 , 徐勇军

IPC: H04W72/0446 , H04W16/22 , H04W28/02 , H04W28/06 , G06N3/045 , G06N3/092

Abstract: 本发明提出一种基于深度强化学习的实时分布式无线网络调度方法和系统，包括：获取由多个接入点和用户节点组成的无线网络；在测试阶段的每个时隙，接入点根据部分数据流对应的发送队列信息，得到各数据流的状态，同时获取之前对无线信道的历史观测信息将数据流的状态和历史观测信息输入至决策模型，接入点执行决策模型输出结果对应的调度决策；在训练阶段，网络中存在的全局决策模型获取所有数据流的状态信息，并给出每个接入点的最优决策动作，接入点执行专家网络给出的最优决策动作，同时将部分数据流的状态，信道的历史观测信息，最优调度决策动作作为交互信息存储至各自的经验回放池中，从各自的经验回放池中抽取经验，训练更新当前决策模型。

4.

发明公开
基于深度强化学习的实时分布式无线网络调度方法和系统有权

公开(公告)号：CN114173418A

公开(公告)日：2022-03-11

申请号：CN202111327838.8

申请日：2021-11-10

Applicant: 中国科学院计算技术研究所

Inventor： 王琪 , 何晨涛 , 黄建辉 , 徐勇军

IPC: H04W72/04 , H04W16/22 , H04W28/02 , H04W28/06 , G06N3/04 , G06N3/08

Abstract: 本发明提出一种基于深度强化学习的实时分布式无线网络调度方法和系统，包括：获取由多个接入点和用户节点组成的无线网络；在测试阶段的每个时隙，接入点根据部分数据流对应的发送队列信息，得到各数据流的状态，同时获取之前对无线信道的历史观测信息将数据流的状态和历史观测信息输入至决策模型，接入点执行决策模型输出结果对应的调度决策；在训练阶段，网络中存在的全局决策模型获取所有数据流的状态信息，并给出每个接入点的最优决策动作，接入点执行专家网络给出的最优决策动作，同时将部分数据流的状态，信道的历史观测信息，最优调度决策动作作为交互信息存储至各自的经验回放池中，从各自的经验回放池中抽取经验，训练更新当前决策模型。

5.

发明授权
无人系统网络智能跨层数据传输方法及系统有权

公开(公告)号：CN110519020B

公开(公告)日：2020-09-11

申请号：CN201910744399.7

申请日：2019-08-13

Applicant: 中国科学院计算技术研究所

Inventor： 王琪 , 何晨涛 , 刘建敏 , 徐勇军 , 徐亦达

IPC: H04L1/16 , H04L1/00 , H04W74/08 , H04B17/382

Abstract: 本发明提出一种无人系统网络智能跨层数据传输方法及系统，包括在路由层采用上限置信区间作为节点选择转发节点的搜索策略；采用双Q学习技术解决由于Q值过高估计导致行为选择评价不准确的问题；回报值的计算综合考虑MAC延时，链路错误概率与位置误差，使其更能反映动作的效益；根据节点速度与MAC延时，为每条链路赋予不同的学习率与折扣因子，实现学习率与折扣因子的自适应调节。最后结合MAC层与路由层，利用MAC延时参数共享实现跨层优化，提出一个无人系统网络智能跨层数据传输方法和系统。

6.

发明公开
基于深度强化学习的实时集中式无线网络调度方法和设备审中-实审

公开(公告)号：CN114189937A

公开(公告)日：2022-03-15

申请号：CN202111327752.5

申请日：2021-11-10

Applicant: 中国科学院计算技术研究所

Inventor： 王琪 , 何晨涛 , 黄建辉 , 徐勇军

IPC: H04W72/04 , H04W24/02 , H04W24/06 , G06N3/04 , G06N3/08

Abstract: 本发明提出一种基于深度强化学习的实时集中式无线网络调度方法和系统，包括：获取由一个接入点和多个用户节点互连组成的无线网络，在每个时隙，接入点根据所有数据流对应的发送队列信息，得到各数据流的状态，集合所有数据流的状态构成当前时隙的环境状态，接入点获取所有数据流的流量模型与链路质量作为环境特征信息，将环境状态和环境特征信息输入至决策模型，接入点执行决策模型输出结果对应的调度决策；接入点执行调度决策后，收到网络环境的反馈；将交互信息和环境状态和环境特征信息作为经验，存储至子区域；从经验回放池中抽取经验，以训练更新当前决策模型。本发明训练时间不会随数据流数量增加而快速增长，能够快速的收敛到最优实时吞吐量。

7.

发明公开
无人系统网络智能跨层数据传输方法及系统有权

公开(公告)号：CN110519020A

公开(公告)日：2019-11-29

申请号：CN201910744399.7

申请日：2019-08-13

Applicant: 中国科学院计算技术研究所

Inventor： 王琪 , 何晨涛 , 刘建敏 , 徐勇军 , 徐亦达

IPC: H04L1/16 , H04L1/00 , H04W74/08 , H04B17/382

Abstract: 本发明提出一种无人系统网络智能跨层数据传输方法及系统，包括在路由层采用上限置信区间作为节点选择转发节点的搜索策略；采用双Q学习技术解决由于Q值过高估计导致行为选择评价不准确的问题；回报值的计算综合考虑MAC延时，链路错误概率与位置误差，使其更能反映动作的效益；根据节点速度与MAC延时，为每条链路赋予不同的学习率与折扣因子，实现学习率与折扣因子的自适应调节。最后结合MAC层与路由层，利用MAC延时参数共享实现跨层优化，提出一个无人系统网络智能跨层数据传输方法和系统。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification