基于先验策略引导下的深度强化学习快速搜索博弈方法及系统

    公开(公告)号:CN118014013A

    公开(公告)日:2024-05-10

    申请号:CN202410046727.7

    申请日:2024-01-12

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于先验策略引导下的深度强化学习快速搜索博弈方法及系统,主要面对双智能体博弈环境。根据博弈环境和博弈规则,获取包括估值函数的估值博弈策略Est(s),将该策略与蒙特卡洛树搜索算法结合,获得启发式蒙特卡洛树搜索算法,并使用该算法进行博弈,获得博弈数据集D;构造神经网络,通过数据集D学习启发式蒙特卡洛树搜索算法,用收敛后的神经网络fη(s)替代启发式蒙特卡洛树搜索中的估值博弈策略Est(s),获得快速神经网络树搜索算法F(s),从而实现深度强化学习的快速搜索博弈。本发明创造了启发式蒙特卡洛树搜索算法,缩短了决策时间,超越了基准模型的博弈水平,有极高的应用价值。

    冠状动脉粥样硬化斑块增长的预测方法

    公开(公告)号:CN109091167A

    公开(公告)日:2018-12-28

    申请号:CN201810720835.2

    申请日:2018-06-29

    Applicant: 东南大学

    CPC classification number: A61B8/5246 A61B5/0066 A61B8/0891 A61B8/12

    Abstract: 本发明属于医学成像技术领域,具体涉及冠状动脉粥样硬化斑块增长的预测方法,将至少两个时刻的IVUS图像和OCT图像分别分割后,再将分割后的IVUS图像和分割后的OCT图像融合,并根据融合后的轮廓建立三维的带有循环弯曲的多模态流固耦合模型,计算模型的力学结果,结合形态学结果,提取力学与形态学的风险因子,并给出斑块增长的指标,利用该机器学习的方法对斑块增长做出预测。从而可以为冠状动脉斑块增长的预测提供一个准确可靠的方法。该发明方法为斑块增长预测提供了临床应用的可能性。

    有向网络下基于RR机制的隐私保护平均一致性方法与系统

    公开(公告)号:CN116723110A

    公开(公告)日:2023-09-08

    申请号:CN202310830018.3

    申请日:2023-07-07

    Applicant: 东南大学

    Abstract: 本发明公开了一种有向网络下基于Round‑Robin机制的隐私保护平均一致性方法与系统,本发明以push‑sum算法为基础,针对该算法在迭代过程中,用户间用于交换的信息是节点真实的状态值,并且单次迭代中用于交换的信息总量过多,存在隐私泄露风险的问题,本发明采用状态分解机制来降低传输信息的准确度,将用户状态分解成两个子状态;一部分是用户私有的,用于自身状态值的更新;另一部分用于信息交换;同时采用Round‑Robin传输机制来减少单次迭代传输的信息量,通过调整权重,使每个用户在单次迭代过程中只向一个邻居传输有效信息。本发明可以在保证每个用户达到平均一致性结果的基础上,确保每个用户的隐私得到保护,且不产生过高的计算成本。

    一种基于动态权值更新的无线传感网络分布式弹性时钟同步方法

    公开(公告)号:CN116347449A

    公开(公告)日:2023-06-27

    申请号:CN202310189366.7

    申请日:2023-03-02

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于动态权值更新的无线传感网络分布式弹性时钟同步方法,包括如下步骤:步骤1、无线传感器网络的每个节点发送自己当前的相关参数信息给所有邻居节点,同时,接收邻居节点发送的信息;步骤2、设计分布式加权时钟同步算法;步骤3、识别虚假数据注入攻击FDI网络攻击;步骤4、引入时变的信誉值repij(k)动态更新权值wij,设计安全防御机制修复因FDI攻击断开的通信信道,实现弹性时钟同步;步骤5、重复上述步骤2‑4,直到时钟同步结束。本发明具有良好的鲁棒性和可拓展性,可用于丰富无线传感器网络时钟同步的理论和应用,为实现时钟同步提供新的思路。

    一种基于混沌粒子群和XGBoost的沥青路面弯沉盆性能预测方法

    公开(公告)号:CN115438869A

    公开(公告)日:2022-12-06

    申请号:CN202211138163.7

    申请日:2022-09-19

    Applicant: 东南大学

    Abstract: 本发明涉及一种基于混沌粒子群和XGBoost的沥青路面弯沉盆性能预测方法,所述方法包括以下步骤:步骤1、采集历年沥青路面使用性能检测数据及沥青路面使用性能影响因素数据,步骤2、根据弯沉盆面积的变化规律,将载荷水平突然变化处作为分割点,确定分段回归的分段区间;步骤3、对步骤2中的每一个分段区间分别建立XGBoost回归器并进行训练;步骤4、通过混沌粒子群优化参数,利用混沌现象的随机性和遍历性的特点来避免局部最优;步骤5、给出结构路面的弯沉盆数据预测。该技术方案利用混沌粒子群对XGBoost的参数和修正后的分段回归方法进行了优化和改进,显著提高了预测效率。

    一种基于多元传递熵和图神经网络的沥青路面车辙预测方法

    公开(公告)号:CN115048862A

    公开(公告)日:2022-09-13

    申请号:CN202210635944.0

    申请日:2022-06-07

    Applicant: 东南大学

    Abstract: 本发明涉及一种基于多元传递熵和图神经网络的沥青路面车辙预测方法,包括以下步骤:步骤1:采集历年沥青路面服役性能监测数据及沥青路面使用性能影响因素数据,根据采集到的数据进行分类;步骤2:将车辙以及影响车辙的多个变量的时间序列转化为图形结构,图形的节点数就是变量的个数,边定义为典型变量与待预测变量的因果关系,步骤3:将图中的节点嵌入门循环单元和自注意力机制可以看作是一个预先训练的模型;步骤4:采用基于谱的图神经网络模型,创建多层模型结构对上述步骤得到的变量节点关系图进行训练,输出多步预测序列。该技术方案基于提出了一种基于多元传递熵和图神经网络的车辙预测模型,提高了车辙预测的精度和泛化能力。

    一种基于复杂网络事件触发同步控制的抗DoS攻击图像加密方法

    公开(公告)号:CN113885333A

    公开(公告)日:2022-01-04

    申请号:CN202111281296.5

    申请日:2021-11-01

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于复杂网络事件触发同步控制的抗DoS攻击图像加密方法,引入了间歇高频DoS攻击方案,采用与攻击形式相对应的切换事件触发传输机制,在有效节约通信资源的同时,缓解了攻击高频发生区域数据传输率低的问题;通过构建合适的多李雅普诺夫函数,提供了一组保证同步误差系统在一定的间歇高频DoS攻击影响下仍能达到均方稳定的充分条件,所得条件保守性低,且易于对其进一步处理得到相应的线性矩阵不等式条件;基于所建立的离散复杂网络事件触发鲁棒同步控制模型获得的混沌序列,保证了密钥的置乱效果,使得密钥生成过程能对抗DoS攻击带来的不利影响且资源消耗少;通过仿真实验表明了该发明能在攻击和资源受限情况下有效实现图像加密功能。

    基于径向基神经网络的沥青路面车辙数据扩充方法

    公开(公告)号:CN115455826A

    公开(公告)日:2022-12-09

    申请号:CN202211113732.2

    申请日:2022-09-14

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于径向基神经网络的沥青路面车辙数据扩充方法,首先采集沥青路面使用性能检测数据及沥青路面使用性能影响因素数据,并对数据进行预处理;再根据获得的数据,进行特征生成,根据皮尔逊相关系数筛选出与车辙数据高度相关的特征;随后构建径向基神经网络扩充模型,以K‑均值算法确定高斯径向基函数的中心,k‑最近邻算法确定高斯径向基函数的半径,确定从隐藏层到输出层的权重矩阵,通过调节隐藏层的神经元个数来达到模型最优;对扩充后的数据进行预测验证,最后将数据扩充模型推广到各个路面数据,根据其特征数据,实现基于径向基神经网络的沥青路面车辙数据扩充。

Patent Agency Ranking