基于预训练模型参数融合的模型微调方法

    公开(公告)号:CN119005277A

    公开(公告)日:2024-11-22

    申请号:CN202410989398.X

    申请日:2024-07-23

    Applicant: 浙江大学

    Abstract: 基于预训练模型参数融合的模型微调方法,包括以下步骤:1)选择是否采用现有的参数融合算法,若是,则跳转至步骤2,否则随机生成线性组合权重p并跳转至步骤3;2)通过该参数融合算法对预训练模型A与预训练模型B进行参数融合,并根据公式m=pa+b逆向推导出p,其中a和b分别代表两个预训练模型的参数,p为线性组合权重,m为融合后模型的参数;3)通过p构建出模型P,并对P进行优化;4)通过公式m=pa+b对两个预训练模型进行合并,得到模型M;5)对模型M进行微调。利用神经网络的学习能力获取最优的模型参数组合,尽可能消除两个模型之间的损失障碍,从而使模型在后续的微调中表现出更加优秀的性能。本方法克服了传统方法中条件过于理想,而在实际合并过程中很难达到理想状态的问题,从而更有效地消除了两个待合并模型之间的损失障碍,让合并后的模型在经过微调后的效果更加优秀。

    基于扩散模型的混凝土大坝裂缝抠图方法和系统

    公开(公告)号:CN118781148A

    公开(公告)日:2024-10-15

    申请号:CN202410793040.X

    申请日:2024-06-19

    Applicant: 浙江大学

    Abstract: 基于扩散模型的混凝土大坝裂缝抠图方法和系统,其方法包括:1)预处理水利大坝图像;2)编码混凝土大坝裂缝特征;3)使用扩散网络去除图像噪声获取裂缝的边界特征;4)结合已知区域调整预测裂缝边界特征;5)后处理大坝图像裂缝分割结果。本发明利用一个裂缝边界特征提取模块获取基础的裂缝边缘信息,以Trimap的形式来指导模型的训练方向,使模型更快拟合到全局最优点,接着使用扩散还原裂缝边界特征模块实现从粗略的Trimap中获取到精细化的抠图结果,再通过一个裂缝边界预测纠正模块,结合标注的信息,使模型更加关注于前景裂缝区域而非背景区域,获得更准确的特征表示方式,提高检测精度,减少漏检情况,从而提升模型的整体性能。

    基于通用分割大模型的少样本大坝裂缝分割方法和系统

    公开(公告)号:CN118736226A

    公开(公告)日:2024-10-01

    申请号:CN202410852379.2

    申请日:2024-06-28

    Applicant: 浙江大学

    Abstract: 基于通用分割大模型的少样本大坝裂缝分割方法和系统,其方法包括:1)构建大坝裂缝分割数据集;2)训练裂缝图像分割器;3)编码有效提示信息;4)获取裂缝分割掩码。该方法结合传统的分割模型和通用分割大模型SAM的优点,在U‑Net架构的网络模型仅需要通过少量裂缝样本使其获得初步的裂缝识别能力,作为前置的通用裂缝分割器。随后将该训练完成的分割器获取的裂缝信息作为提示信息输入SAM的编码器中,通过编码器过滤无效信息整合有效信息获得提示信息的编码向量,和图像向量一起输入编码器中获取精确的裂缝掩码。本发明的方法克服了目前基于裂缝数据有监督训练的图像分割方法在样本不足的情况下往往难以达到最优效果且鲁棒性不高,进行迁移时效果不佳的问题,利用传统的分割模型和通用分割大模型SAM相结合,获取有效提示信息,提高了大坝裂缝分割方法的准确性、检出率和鲁棒性。

    基于数据库管理系统的深度神经网络推理方法和装置

    公开(公告)号:CN118278468A

    公开(公告)日:2024-07-02

    申请号:CN202410695887.4

    申请日:2024-05-31

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于数据库管理系统的深度神经网络推理方法和装置,包括:将预训练神经网络模型参数转换为二进制格式;根据不同的目标任务,使用对应的目标数据集微调将参数已转换为二进制格式的预训练神经网络模型,并在微调中,通过概率模型和剪枝技术,去除冗余参数,得到轻量化模型;将若干个所述轻量化模型部署到数据库管理系统中,即SmartLite;其中,所述预训练神经网络模型的结构和参数作为共享块;当所述SmartLite接受到混合查询请求,至少调用一个模型进行推理;所述混合查询包括SQL查询和深度学习模型推理。本发明计算效率显著提升,使用查找表和比特操作优化,在各种计算任务中显著提高了计算速度。

    一种基于数据湖的查询方法和装置

    公开(公告)号:CN118227656A

    公开(公告)日:2024-06-21

    申请号:CN202410650121.4

    申请日:2024-05-24

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于数据湖的查询方法和装置,包括:根据用户输入,对查询的目标数据集进行采样,得到模式信息M和数据样本信息,从而构建查询;将查询分解成若干个子任务,从而构建处理图;修正处理图,采用shuffle技术和/或Collapse技术,并结合成本模型对修正后的处理图进行优化;根据优化后的处理图生成代码并执行,以输出用户查询结果。本发明无需中介模式,简化查询过程,不需要数据转换和加载,简化了操作,从整体上提高了查询效率。在查询细节上,设计了针对LLM生成代码的查询优化器,极大提高了LLM生成代码的执行效率和对应方法的可解释性,其中对处理图修正以辅助LLM能提高查询准确性,使整个自然语言查询任务的准确性超过传统方法。

    构建用于多晶材料塑性行为预测的多任务图网络模型框架的方法和装置

    公开(公告)号:CN118194705A

    公开(公告)日:2024-06-14

    申请号:CN202410293647.1

    申请日:2024-03-14

    Applicant: 浙江大学

    Abstract: 构建用于多晶材料塑性行为预测的多任务图网络模型框架的方法和装置,其方法包括如下步骤:1)构建多晶微观结构代表性体积元,利用DREAM.3D软件构建数据集;2)CPFFT模拟单轴拉伸下多晶材料塑性变形,使用开源软件DAMASK来模拟每个微观结构的拉伸变形;3)构建多晶材料塑性行为预测数据集;4)预处理多晶材料数据;5)引入图表示学习框架,通过引注意力残差图神经网络实现多晶材料微观图结构中各个节点和边级特征的处理;6)构建多任务图网络框架,经过图神经网络的特征处理,对节点和边的特征进一步学习;7)优化多任务损失,通过求和权重对不同的任务进行优化上的考量;8)进行单轴拉伸下多晶材料塑性行为预测任务。

    一种两阶段生成的细粒度车辆轨迹生成方法

    公开(公告)号:CN117290408A

    公开(公告)日:2023-12-26

    申请号:CN202311216746.1

    申请日:2023-09-20

    Applicant: 浙江大学

    Abstract: 一种两阶段生成的细粒度车辆轨迹生成方法,包括:步骤1)生成Geohash下的区域转移轨迹:首先对车辆轨迹进行Geohash,找到车辆GPS坐标对应的Geohash编码,从而原始数据中得到在Geohash这种粗粒度下车辆的转移轨迹,之后,使用GAN模型学习不同区域之间的转移规律,从而生成Geohash间转移的连续的轨迹;步骤2)生成基于驾驶意图的细粒度轨迹:根据生成的Geohash区域确定区域内的转移轨迹,预测的粒度为道路之间的转移轨迹,包括对转移轨迹的起始/终止位置进行确定,预测道路节点间的路径。本发明的优点在于,通过两阶段生成的方式,同时考虑整体转移模式和个体驾驶行为,能够实现对个体行为的更加精细化建模,从而提高轨迹生成的准确性和可靠性。

Patent Agency Ranking