基于注意力机制和深度强化学习的电网潮流调整方法

    公开(公告)号:CN114970351A

    公开(公告)日:2022-08-30

    申请号:CN202210601241.6

    申请日:2022-05-30

    Applicant: 浙江大学

    Abstract: 基于注意力机制和深度强化学习的电网潮流调整方法。本发明基于注意力机制构建深度强化学习模型,能够自动学习并解决电网潮流调整任务。首先基于马尔可夫决策过程和潮流仿真程序构建强化学习交互环境,基于注意力机制构建神经网络模型作为智能体;之后随机初始化电网潮流状态,随机选择需要进行潮流调整的电网线路或断面并随机设定合理范围内的目标功率;随后智能体与环境交互采集数据存入经验池,使用双竞争深度Q网络算法训练更新智能体参数。本发明的优点在于,通过智能体自主与环境交互来学习发电机调度策略,实现了断面功率控制的自动化,相比基于专家知识的人工调整方法具有更强的自适应性;引入注意力机制,建模捕获调整目标和全局电气特征的关系,提高了算法的准确度。

    一种推荐系统针对物品排序的内部错误定位的方法和装置

    公开(公告)号:CN117593073A

    公开(公告)日:2024-02-23

    申请号:CN202311415334.0

    申请日:2023-10-30

    Applicant: 浙江大学

    Abstract: 一种推荐系统针对物品排序的内部错误定位方法和装置,其方法包括:1)对物品预期曝光进行估计:开启短时间小流量实验,将物品强插至精排模块计算预估分,并强插至精排展现结果进行曝光;计算该批次物品的用户行为打分与精排预估分的一致性,确保精排正确性;模拟一系列请求,计算该物品通过精排进行曝光与未在精排候选但精排预估分排序位次应被曝光的情形的次数占比;2)当预期曝光量超过现有曝光量3倍时,分别对粗排模块和召回模块进行排查,对问题进行定位。本发明对物品的预期曝光做出准确估计,排除了低质量物品的可能;给出了各阶段准确性的明确判定标准;提出了根据各阶段预估分数一致性作为判定依据的新思路。

    基于分布式多智能体强化学习的电网多断面功率控制方法

    公开(公告)号:CN112615379B

    公开(公告)日:2022-05-13

    申请号:CN202011451510.2

    申请日:2020-12-10

    Applicant: 浙江大学

    Abstract: 基于分布式多智能体强化学习的电网多断面功率自动控制方法,通过多智能体与电力仿真环境交互,能够自主学习合适的用于复杂电网的多断面功率控制策略。首先根据电网控制的需要选取N个目标断面,并依此构建强化学习方法的环境、智能体、观测状态、动作、奖励函数等基本元素;其次运行多断面功率控制任务交互环境,创造初始潮流数据集;之后,为每个智能体构造基于深度神经网络的决策网络和估值网络,构建MADDPG(多智能体深度确定性策略梯度)模型并引入分布式方法进行训练自主学习最优控制策略;最后,应用训练完成的策略网络自动断面控制。本发明的优点在于,采用多智能体强化学习方法处理复杂的电网多断面功率控制问题,具有较高的控制成功率且无需专家经验,同时引入分布式方法大幅提升了智能体训练效率。

    基于分布式多智能体强化学习的电网多断面功率自动控制方法

    公开(公告)号:CN112615379A

    公开(公告)日:2021-04-06

    申请号:CN202011451510.2

    申请日:2020-12-10

    Applicant: 浙江大学

    Abstract: 基于分布式多智能体强化学习的电网多断面功率自动控制方法,通过多智能体与电力仿真环境交互,能够自主学习合适的用于复杂电网的多断面功率控制策略。首先根据电网控制的需要选取N个目标断面,并依此构建强化学习方法的环境、智能体、观测状态、动作、奖励函数等基本元素;其次运行多断面功率控制任务交互环境,创造初始潮流数据集;之后,为每个智能体构造基于深度神经网络的决策网络和估值网络,构建MADDPG(多智能体深度确定性策略梯度)模型并引入分布式方法进行训练自主学习最优控制策略;最后,应用训练完成的策略网络自动断面控制。本发明的优点在于,采用多智能体强化学习方法处理复杂的电网多断面功率控制问题,具有较高的控制成功率且无需专家经验,同时引入分布式方法大幅提升了智能体训练效率。

    基于程序轮廓分析的虚拟化平台性能评测方法

    公开(公告)号:CN102222034A

    公开(公告)日:2011-10-19

    申请号:CN201110200015.9

    申请日:2011-07-15

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于轮廓分析的虚拟化平台性能评测方法,包括:利用轮廓分析技术获取宏观负载的资源请求,包括:CPU各类操作数量、造成虚拟机上下文切换的虚拟机敏感操作数量、内存读写数量及缓存命中率、磁盘读写数据量、网络读写数据量;利用微观基准测试获取待测虚拟化平台的资源供给能力,包括:CPU各类操作速度、虚拟机敏感操作延时、内存读写速度及缓存读写速度、磁盘读写速度、网络读写速度;计算宏观负载的响应时间、CPU利用率、磁盘利用率和网络利用率。本发明方法使用程序轮廓分析技术获取宏观负载的资源请求,利用微观基准测试得到待测虚拟平台的资源供给,并结合前两者分析计算宏观性能,降低了测试的复杂度与成本。

    基于注意力机制和深度强化学习的电网潮流调整方法

    公开(公告)号:CN114970351B

    公开(公告)日:2024-11-05

    申请号:CN202210601241.6

    申请日:2022-05-30

    Applicant: 浙江大学

    Abstract: 基于注意力机制和深度强化学习的电网潮流调整方法。本发明基于注意力机制构建深度强化学习模型,能够自动学习并解决电网潮流调整任务。首先基于马尔可夫决策过程和潮流仿真程序构建强化学习交互环境,基于注意力机制构建神经网络模型作为智能体;之后随机初始化电网潮流状态,随机选择需要进行潮流调整的电网线路或断面并随机设定合理范围内的目标功率;随后智能体与环境交互采集数据存入经验池,使用双竞争深度Q网络算法训练更新智能体参数。本发明的优点在于,通过智能体自主与环境交互来学习发电机调度策略,实现了断面功率控制的自动化,相比基于专家知识的人工调整方法具有更强的自适应性;引入注意力机制,建模捕获调整目标和全局电气特征的关系,提高了算法的准确度。

    一种基于卷积神经网络的肺结节假阳性筛选方法

    公开(公告)号:CN108230323B

    公开(公告)日:2021-03-23

    申请号:CN201810092249.8

    申请日:2018-01-30

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于卷积神经网络的肺结节假阳性筛选方法,包括:(1)获得肺结节检测模型输出的肺结节检测结果;(2)对肺结节检测结果进行标记生成样本;(3)根据样本和原始肺部CT图像构建数据集合;(4)将数据集合中的每个数据对的坐标x进行8个方向的随机偏移,偏移尺度为0.5X;(5)对数据集合中的每个数据对,根据样本对原始肺部CT图像进行裁剪,获得不同尺寸的训练样本,并对训练样本进行增广处理;(6)构建卷积神经网络;(7)利用3中尺寸的训练样本对卷积神经网路进行训练,获得三个肺结节假阳性筛选模型;(8)利用肺结节假阳性筛选模型对待测样本进行预测,输出预测结果。

Patent Agency Ranking