-
公开(公告)号:CN116890855A
公开(公告)日:2023-10-17
申请号:CN202310648155.5
申请日:2023-06-02
Applicant: 浙江大学
Abstract: 基于逆强化学习的自动驾驶选道决策方法和系统,其方法包括:利用规划算法构造专家策略在highway‑env环境中进行仿真得到专家数据集。然后,在强化学习的行动器‑评判器网络架构基础上重构局部奖励函数:在强化学习过程中利用扩展混合评判网络池衡量智能体对于状态的不确定度进而选择课程化子目标;基于子目标重构局部匹配奖励函数引导智能体按照专家轨迹行动。最后利用基于元模仿目标,在强化学习过程中间利用元模仿学习的方法更新局部内在奖励生成器,引导智能体在专家数据附近探索,从奖励函数角度推理建模专家意图,从而进一步引导智能体靠近专家策略。
-
公开(公告)号:CN116620327A
公开(公告)日:2023-08-22
申请号:CN202310730740.X
申请日:2023-06-20
Applicant: 浙江大学
Abstract: 基于PPO和Lattice实现自动驾驶的高速场景的变道决策方法及系统,包括:1)收集人工驾驶车辆的行驶数据,解析整合出轨迹数据和行驶动作数据;2)通过仿真模拟系统对场景、道路、车辆、交通流进行模拟建模;3)以深度PPO模型作为训练过程中的智能体;4)训练过程中将从仿真环境中获得的车辆信息、地图信息等输入进深度网络模型,进行梯度更新并输出得到新的轨迹预测动作;5)将轨迹预测动作作为Lattice Planner的输入,计算规划器输出的每条轨迹的cost,选择cost最低的轨迹,得到模拟器规划的轨迹;6)将新的预测轨迹输入进仿真模拟环境来更新新的车辆信息、地图信息等;7)计算每个轨迹动作对应的奖励和惩罚8)重复4‑7步骤多次,强化学习网络进行重要性采样数据进行训练,通过N步参数更新法对强化学习网络进行更新,保存模型参数,得到最终的策略模型。9)基于最终的车辆策略模型,结合车辆、地图、环境信息,制定直接控制车辆的控制策略。
-
公开(公告)号:CN115761453B
公开(公告)日:2023-08-04
申请号:CN202211285599.9
申请日:2022-10-20
Applicant: 浙江大学
IPC: G06V20/00 , G06V10/82 , G06N3/0464 , G06N3/08 , G06N5/04
Abstract: 基于特征匹配的轻量化单样本目标检测方法,包括下列步骤:1)基于掩码的基类别目标检测模型训练;2)新类别标注样本的数据增强;3)新类别标注样本的特征提取;4)模型在测试数据上的初步推理;5)使用传统特征修正推理结果。通过上述步骤,本发明实现了在每个类别标注样本极其稀少情况下(1个)的目标检测,并克服了传统单样本目标检测中依赖于测试图像类别先验知识的问题,同时还使用神经架构搜索,在尽量保持模型性能的同时减少模型的参数量。
-
公开(公告)号:CN116502380A
公开(公告)日:2023-07-28
申请号:CN202310499262.6
申请日:2023-05-06
IPC: G06F30/18 , G06F30/27 , G06F17/16 , G06F119/02
Abstract: 用于定位暂态失稳子结构的可解释图神经网络方法和系统,包括:首先,将电网数据处理为图结构数据,引入了第一图卷积神经网络作为编码层学习电网中间节点嵌入;然后通过计算图结构的电网数据的节点特征相似度和局部拓扑结构相似度,获得边采样权重;根据边采样权重采样解释子图获取采样掩码矩阵,通过此矩阵控制第二图神经网络运行和分类任务,并在反向传播过程中自定义采样梯度计算方法;最后根据采样掩码矩阵定位电网暂态失稳子结构,根据分类器获得电网数据稳态情况。本发明还包含基于可解释图神经网络的电网暂态失稳定位方法的系统。本发明在使用图神经网络判断电网暂态稳定性的基础上,运用子图可解释技术定位电网暂态失稳子结构。
-
公开(公告)号:CN115660324B
公开(公告)日:2023-06-13
申请号:CN202211227530.0
申请日:2022-10-09
Applicant: 浙江大学
IPC: G06Q10/0631 , G06Q50/06 , H02J3/46 , G06N3/0464 , G06N3/092
Abstract: 基于图强化学习的电网多断面越限调控方法,首先,基于典型日构建一系列电网多断面越限数据集,并利用图卷积神经网络计算电网节点的嵌入矩阵,利用多层感知机计算断面任务的嵌入表示;根据节点嵌入和任务嵌入生成多断面任务归因图,用以指导智能体对发电机的调度行为;利用加权池化的方法提取电网图表示特征。然后,在基于竞争架构的深度Q网络基础上构建发电机调度强化学习框架,该框架根据电网图表示特征估计各动作的期望奖励值。最后,智能体通过该框架选择最合理的发电机调度动作,实现对电网多断面越限情景的调控。本发明还包括基于图强化学习的电网多断面越限调控系统。
-
公开(公告)号:CN113725853B
公开(公告)日:2022-10-11
申请号:CN202111017503.6
申请日:2021-08-30
Applicant: 浙江大学 , 国网浙江省电力有限公司
Abstract: 基于主动性人在回路强化学习的电网拓扑控制方法,首先,将电网数据的节点特征进行对齐从而构建可训练的同构图数据,并采用图卷积神经网络来聚合提取图表示特征。然后,在强化学习的行动器‑评判器网络架构基础上加入动作询问器和自适应状态选择器以实现主动性人在回路框架:利用动作扩展器赋予智能体可主动询问人类专家的动作;使用自适应状态选择器筛选过滤训练过程中的不稳定电网状态,提高这些电网状态的专家询问需求概率,并起到对动作扩展器的补充增强作用。最后,智能体能通过该框架来主动寻求人类专家的干涉,利用专家拓扑控制动作加快其学习效率并保持较低的人类专家依赖性。本发明还包括基于主动性人在回路强化学习的电网拓扑控制方法的系统。
-
公开(公告)号:CN114330554A
公开(公告)日:2022-04-12
申请号:CN202111639661.5
申请日:2021-12-29
Applicant: 浙江大学
Abstract: 一种面向智能安防的视觉深度模型知识重组方法,首先,收集安防边缘测的视觉数据,明确模型任务,收集数据进行标注,训练目标任务模型。然后,利用归因图计算目标模型和不同预训练模型之间的可迁移分数,将归一化的可迁移分数作为模型选择的概率,可放回地采样形成模型集合;在联邦学习范式的基础上,将目标模型分发到不同的节点,利用表征蒸馏迁移预训练模型的特征提取能力,在目标模型学习和迁移完成后,通过平均的方式在中心节点进行知识重组,重组过后的模型再次分发到选择的模型节点进一步迭代。最后,再利用目标数据集进行微调目标模型,从而学习得到一个在智能安防领域的目标任务上表现良好的视觉深度模型,并且保护了数据隐私和模型隐私。
-
公开(公告)号:CN113240105B
公开(公告)日:2022-01-07
申请号:CN202110375699.X
申请日:2021-03-30
Applicant: 浙江大学 , 国网浙江省电力有限公司
Abstract: 本发明属于电力系统潮流计算和图表示学习领域,综合考虑电网拓扑结构和图网络结构的特性,提出了一种基于图神经网络池化的电网稳态判别方法。首先,将电网数据处理为图网络结构数据并通过引入图同构网络(GraphIsomorphismNetwork)来实现电网图中各个节点信息的预处理。然后,使用最大似然估计方法将得到的特征矩阵建模为高斯模型,并分别对高斯模型中的均值和协方差两部分分量进行池化操作。最后,将池化后的两部分分量进行融合得到最终的表示形式,应用于电网运行状态判别。本发明结合人工智能领域的研究热点和电网领域的经典问题,在电网的潮流计算领域做出了新的尝试并取得了较好的效果,具有较高的应用价值和发展前景。
-
公开(公告)号:CN113725853A
公开(公告)日:2021-11-30
申请号:CN202111017503.6
申请日:2021-08-30
Applicant: 浙江大学 , 国网浙江省电力有限公司
Abstract: 基于主动性人在回路强化学习的电网拓扑控制方法,首先,将电网数据的节点特征进行对齐从而构建可训练的同构图数据,并采用图卷积神经网络来聚合提取图表示特征。然后,在强化学习的行动器‑评判器网络架构基础上加入动作询问器和自适应状态选择器以实现主动性人在回路框架:利用动作扩展器赋予智能体可主动询问人类专家的动作;使用自适应状态选择器筛选过滤训练过程中的不稳定电网状态,提高这些电网状态的专家询问需求概率,并起到对动作扩展器的补充增强作用。最后,智能体能通过该框架来主动寻求人类专家的干涉,利用专家拓扑控制动作加快其学习效率并保持较低的人类专家依赖性。本发明还包括基于主动性人在回路强化学习的电网拓扑控制方法的系统。
-
公开(公告)号:CN113240105A
公开(公告)日:2021-08-10
申请号:CN202110375699.X
申请日:2021-03-30
Applicant: 浙江大学 , 国网浙江省电力有限公司
Abstract: 本发明属于电力系统潮流计算和图表示学习领域,综合考虑电网拓扑结构和图网络结构的特性,提出了一种基于图神经网络池化的电网稳态判别方法。首先,将电网数据处理为图网络结构数据并通过引入图同构网络(GraphIsomorphismNetwork)来实现电网图中各个节点信息的预处理。然后,使用最大似然估计方法将得到的特征矩阵建模为高斯模型,并分别对高斯模型中的均值和协方差两部分分量进行池化操作。最后,将池化后的两部分分量进行融合得到最终的表示形式,应用于电网运行状态判别。本发明结合人工智能领域的研究热点和电网领域的经典问题,在电网的潮流计算领域做出了新的尝试并取得了较好的效果,具有较高的应用价值和发展前景。
-
-
-
-
-
-
-
-
-