-
公开(公告)号:CN114745337B
公开(公告)日:2023-11-28
申请号:CN202210204528.5
申请日:2022-03-03
Applicant: 武汉大学
Abstract: 本发明公开了一种基于深度强化学习的实时拥塞控制方法,涉及计算机网络与人工智能的交叉领域。该方法包括构建仿真网络,在仿真网络中按照设定的每回合时间长度,来构建数据传输程序;初始化强化学习智能体及内部神经网络,采集网络统计信息及动作滞后时间以训练滞后预测模型,接着固定滞后预测模型,用强化学习算法训练神经网络,最后将神经网络模型部署至目标网络环境中,让智能体能根据当前的网络状态数据动态地调整拥塞控制窗口的大小,在数据传输过程中取得更高的吞吐量和更低的往返时延。本发明以扩展状态空间和单独预测滞后时间的方式解决了应用深度强化学习至拥塞控制时的动作滞后问题,可以兼顾拥塞控制效果和较高的网络性能。
-
公开(公告)号:CN112418293A
公开(公告)日:2021-02-26
申请号:CN202011296097.7
申请日:2020-11-18
Applicant: 武汉大学
IPC: G06K9/62 , G06F16/2458 , G16H50/70
Abstract: 本发明公开了一种基于信息度和代表度的主动学习抽样方法,该方法包括以下步骤:1)对未标注数据集中多元时间序列,获取各时间序列的信息度和代表度;2)基于步骤1)中计算得到的信息度和代表度,通过抽样算法得到最有价值的未标记样本;3)对步骤2)抽样所得的未标注样本进行标注,并将标注后的样本加入标注数据集;4)判断是否满足停止标准,满足停止标准后得到更新后的标记数据集。本发明针对多元时间序列的主动学习问题,提出了一种抽取未标记时间序列样本的有效抽样算法,通过双优化抽样算法结合信息度和代表度进行抽样,能在保证准确度的条件下,有效减少未标记样本的抽样数目。
-
公开(公告)号:CN114745337A
公开(公告)日:2022-07-12
申请号:CN202210204528.5
申请日:2022-03-03
Applicant: 武汉大学
Abstract: 本发明公开了一种基于深度强化学习的实时拥塞控制方法,涉及计算机网络与人工智能的交叉领域。该方法包括构建仿真网络,在仿真网络中按照设定的每回合时间长度,来构建数据传输程序;初始化强化学习智能体及内部神经网络,采集网络统计信息及动作滞后时间以训练滞后预测模型,接着固定滞后预测模型,用强化学习算法训练神经网络,最后将神经网络模型部署至目标网络环境中,让智能体能根据当前的网络状态数据动态地调整拥塞控制窗口的大小,在数据传输过程中取得更高的吞吐量和更低的往返时延。本发明以扩展状态空间和单独预测滞后时间的方式解决了应用深度强化学习至拥塞控制时的动作滞后问题,可以兼顾拥塞控制效果和较高的网络性能。
-
-