基于PPO和Lattice实现自动驾驶的高速场景的变道决策方法

    公开(公告)号:CN116620327A

    公开(公告)日:2023-08-22

    申请号:CN202310730740.X

    申请日:2023-06-20

    Applicant: 浙江大学

    Abstract: 基于PPO和Lattice实现自动驾驶的高速场景的变道决策方法及系统,包括:1)收集人工驾驶车辆的行驶数据,解析整合出轨迹数据和行驶动作数据;2)通过仿真模拟系统对场景、道路、车辆、交通流进行模拟建模;3)以深度PPO模型作为训练过程中的智能体;4)训练过程中将从仿真环境中获得的车辆信息、地图信息等输入进深度网络模型,进行梯度更新并输出得到新的轨迹预测动作;5)将轨迹预测动作作为Lattice Planner的输入,计算规划器输出的每条轨迹的cost,选择cost最低的轨迹,得到模拟器规划的轨迹;6)将新的预测轨迹输入进仿真模拟环境来更新新的车辆信息、地图信息等;7)计算每个轨迹动作对应的奖励和惩罚8)重复4‑7步骤多次,强化学习网络进行重要性采样数据进行训练,通过N步参数更新法对强化学习网络进行更新,保存模型参数,得到最终的策略模型。9)基于最终的车辆策略模型,结合车辆、地图、环境信息,制定直接控制车辆的控制策略。

    基于特征匹配的轻量化单样本目标检测方法

    公开(公告)号:CN115761453B

    公开(公告)日:2023-08-04

    申请号:CN202211285599.9

    申请日:2022-10-20

    Applicant: 浙江大学

    Abstract: 基于特征匹配的轻量化单样本目标检测方法,包括下列步骤:1)基于掩码的基类别目标检测模型训练;2)新类别标注样本的数据增强;3)新类别标注样本的特征提取;4)模型在测试数据上的初步推理;5)使用传统特征修正推理结果。通过上述步骤,本发明实现了在每个类别标注样本极其稀少情况下(1个)的目标检测,并克服了传统单样本目标检测中依赖于测试图像类别先验知识的问题,同时还使用神经架构搜索,在尽量保持模型性能的同时减少模型的参数量。

    基于可解释图神经网络的电网暂态失稳定位方法和系统

    公开(公告)号:CN116502380A

    公开(公告)日:2023-07-28

    申请号:CN202310499262.6

    申请日:2023-05-06

    Abstract: 用于定位暂态失稳子结构的可解释图神经网络方法和系统,包括:首先,将电网数据处理为图结构数据,引入了第一图卷积神经网络作为编码层学习电网中间节点嵌入;然后通过计算图结构的电网数据的节点特征相似度和局部拓扑结构相似度,获得边采样权重;根据边采样权重采样解释子图获取采样掩码矩阵,通过此矩阵控制第二图神经网络运行和分类任务,并在反向传播过程中自定义采样梯度计算方法;最后根据采样掩码矩阵定位电网暂态失稳子结构,根据分类器获得电网数据稳态情况。本发明还包含基于可解释图神经网络的电网暂态失稳定位方法的系统。本发明在使用图神经网络判断电网暂态稳定性的基础上,运用子图可解释技术定位电网暂态失稳子结构。

    基于图强化学习的电网多断面越限调控方法和系统

    公开(公告)号:CN115660324B

    公开(公告)日:2023-06-13

    申请号:CN202211227530.0

    申请日:2022-10-09

    Applicant: 浙江大学

    Abstract: 基于图强化学习的电网多断面越限调控方法,首先,基于典型日构建一系列电网多断面越限数据集,并利用图卷积神经网络计算电网节点的嵌入矩阵,利用多层感知机计算断面任务的嵌入表示;根据节点嵌入和任务嵌入生成多断面任务归因图,用以指导智能体对发电机的调度行为;利用加权池化的方法提取电网图表示特征。然后,在基于竞争架构的深度Q网络基础上构建发电机调度强化学习框架,该框架根据电网图表示特征估计各动作的期望奖励值。最后,智能体通过该框架选择最合理的发电机调度动作,实现对电网多断面越限情景的调控。本发明还包括基于图强化学习的电网多断面越限调控系统。

    基于主动性人在回路强化学习的电网拓扑控制方法和系统

    公开(公告)号:CN113725853B

    公开(公告)日:2022-10-11

    申请号:CN202111017503.6

    申请日:2021-08-30

    Abstract: 基于主动性人在回路强化学习的电网拓扑控制方法,首先,将电网数据的节点特征进行对齐从而构建可训练的同构图数据,并采用图卷积神经网络来聚合提取图表示特征。然后,在强化学习的行动器‑评判器网络架构基础上加入动作询问器和自适应状态选择器以实现主动性人在回路框架:利用动作扩展器赋予智能体可主动询问人类专家的动作;使用自适应状态选择器筛选过滤训练过程中的不稳定电网状态,提高这些电网状态的专家询问需求概率,并起到对动作扩展器的补充增强作用。最后,智能体能通过该框架来主动寻求人类专家的干涉,利用专家拓扑控制动作加快其学习效率并保持较低的人类专家依赖性。本发明还包括基于主动性人在回路强化学习的电网拓扑控制方法的系统。

    一种面向智能安防的视觉深度模型知识重组方法

    公开(公告)号:CN114330554A

    公开(公告)日:2022-04-12

    申请号:CN202111639661.5

    申请日:2021-12-29

    Applicant: 浙江大学

    Abstract: 一种面向智能安防的视觉深度模型知识重组方法,首先,收集安防边缘测的视觉数据,明确模型任务,收集数据进行标注,训练目标任务模型。然后,利用归因图计算目标模型和不同预训练模型之间的可迁移分数,将归一化的可迁移分数作为模型选择的概率,可放回地采样形成模型集合;在联邦学习范式的基础上,将目标模型分发到不同的节点,利用表征蒸馏迁移预训练模型的特征提取能力,在目标模型学习和迁移完成后,通过平均的方式在中心节点进行知识重组,重组过后的模型再次分发到选择的模型节点进一步迭代。最后,再利用目标数据集进行微调目标模型,从而学习得到一个在智能安防领域的目标任务上表现良好的视觉深度模型,并且保护了数据隐私和模型隐私。

    一种基于图神经网络池化的电网稳态判别方法

    公开(公告)号:CN113240105B

    公开(公告)日:2022-01-07

    申请号:CN202110375699.X

    申请日:2021-03-30

    Abstract: 本发明属于电力系统潮流计算和图表示学习领域,综合考虑电网拓扑结构和图网络结构的特性,提出了一种基于图神经网络池化的电网稳态判别方法。首先,将电网数据处理为图网络结构数据并通过引入图同构网络(GraphIsomorphismNetwork)来实现电网图中各个节点信息的预处理。然后,使用最大似然估计方法将得到的特征矩阵建模为高斯模型,并分别对高斯模型中的均值和协方差两部分分量进行池化操作。最后,将池化后的两部分分量进行融合得到最终的表示形式,应用于电网运行状态判别。本发明结合人工智能领域的研究热点和电网领域的经典问题,在电网的潮流计算领域做出了新的尝试并取得了较好的效果,具有较高的应用价值和发展前景。

    基于主动性人在回路强化学习的电网拓扑控制方法和系统

    公开(公告)号:CN113725853A

    公开(公告)日:2021-11-30

    申请号:CN202111017503.6

    申请日:2021-08-30

    Abstract: 基于主动性人在回路强化学习的电网拓扑控制方法,首先,将电网数据的节点特征进行对齐从而构建可训练的同构图数据,并采用图卷积神经网络来聚合提取图表示特征。然后,在强化学习的行动器‑评判器网络架构基础上加入动作询问器和自适应状态选择器以实现主动性人在回路框架:利用动作扩展器赋予智能体可主动询问人类专家的动作;使用自适应状态选择器筛选过滤训练过程中的不稳定电网状态,提高这些电网状态的专家询问需求概率,并起到对动作扩展器的补充增强作用。最后,智能体能通过该框架来主动寻求人类专家的干涉,利用专家拓扑控制动作加快其学习效率并保持较低的人类专家依赖性。本发明还包括基于主动性人在回路强化学习的电网拓扑控制方法的系统。

    一种基于图神经网络池化的电网稳态判别方法

    公开(公告)号:CN113240105A

    公开(公告)日:2021-08-10

    申请号:CN202110375699.X

    申请日:2021-03-30

    Abstract: 本发明属于电力系统潮流计算和图表示学习领域,综合考虑电网拓扑结构和图网络结构的特性,提出了一种基于图神经网络池化的电网稳态判别方法。首先,将电网数据处理为图网络结构数据并通过引入图同构网络(GraphIsomorphismNetwork)来实现电网图中各个节点信息的预处理。然后,使用最大似然估计方法将得到的特征矩阵建模为高斯模型,并分别对高斯模型中的均值和协方差两部分分量进行池化操作。最后,将池化后的两部分分量进行融合得到最终的表示形式,应用于电网运行状态判别。本发明结合人工智能领域的研究热点和电网领域的经典问题,在电网的潮流计算领域做出了新的尝试并取得了较好的效果,具有较高的应用价值和发展前景。

    基于知识重组的语义图像压缩方法

    公开(公告)号:CN110930408B

    公开(公告)日:2021-06-18

    申请号:CN201910980491.3

    申请日:2019-10-15

    Applicant: 浙江大学

    Abstract: 一种基于知识重组的语义图像压缩方法,包括下列步骤:1)获得预训练的编解码器结构模型以及无标签数据;分别选取图像压缩以及语义分割的预训练同构模型。语义分割模型对输入图像进行逐像素类别预测,图像压缩模型对数字图像进行压缩和解压;2)模型重组;对预训练模型的编码器进行零填充重组得到共享编码器,复用预训练模型的解码器形成多路解码的结构。该重组模型在功能上等价于多个独立模型,能够执行语义分割和图像压缩任务。3)迭代剪枝减小模型规模;基于余弦相似度计算重组模型各层参数的相似度,对相似度最高的卷积核进行剪枝。每轮剪枝后,以无标签数据作为重组模型的输入,以预训练模型的预测结果作为学习目标,进行多任务训练直至收敛。重复步骤3)直至重组模型性能和参数规模达到部署要求。最终的重组模型能够对图像进行压缩,同时可以根据需求从编码中解码原图或者解码语义,两个任务可独立执行。

Patent Agency Ranking