-
公开(公告)号:CN119005277A
公开(公告)日:2024-11-22
申请号:CN202410989398.X
申请日:2024-07-23
Applicant: 浙江大学
Abstract: 基于预训练模型参数融合的模型微调方法,包括以下步骤:1)选择是否采用现有的参数融合算法,若是,则跳转至步骤2,否则随机生成线性组合权重p并跳转至步骤3;2)通过该参数融合算法对预训练模型A与预训练模型B进行参数融合,并根据公式m=pa+b逆向推导出p,其中a和b分别代表两个预训练模型的参数,p为线性组合权重,m为融合后模型的参数;3)通过p构建出模型P,并对P进行优化;4)通过公式m=pa+b对两个预训练模型进行合并,得到模型M;5)对模型M进行微调。利用神经网络的学习能力获取最优的模型参数组合,尽可能消除两个模型之间的损失障碍,从而使模型在后续的微调中表现出更加优秀的性能。本方法克服了传统方法中条件过于理想,而在实际合并过程中很难达到理想状态的问题,从而更有效地消除了两个待合并模型之间的损失障碍,让合并后的模型在经过微调后的效果更加优秀。
-
公开(公告)号:CN118781148A
公开(公告)日:2024-10-15
申请号:CN202410793040.X
申请日:2024-06-19
Applicant: 浙江大学
IPC: G06T7/194 , G06T7/13 , G06T7/12 , G06T7/00 , G06T5/20 , G06T5/40 , G06T5/50 , G06T5/60 , G06T5/70 , G06T5/90 , G06V10/44 , G06V10/82 , G06N3/0455 , G06N3/0464
Abstract: 基于扩散模型的混凝土大坝裂缝抠图方法和系统,其方法包括:1)预处理水利大坝图像;2)编码混凝土大坝裂缝特征;3)使用扩散网络去除图像噪声获取裂缝的边界特征;4)结合已知区域调整预测裂缝边界特征;5)后处理大坝图像裂缝分割结果。本发明利用一个裂缝边界特征提取模块获取基础的裂缝边缘信息,以Trimap的形式来指导模型的训练方向,使模型更快拟合到全局最优点,接着使用扩散还原裂缝边界特征模块实现从粗略的Trimap中获取到精细化的抠图结果,再通过一个裂缝边界预测纠正模块,结合标注的信息,使模型更加关注于前景裂缝区域而非背景区域,获得更准确的特征表示方式,提高检测精度,减少漏检情况,从而提升模型的整体性能。
-
公开(公告)号:CN118736226A
公开(公告)日:2024-10-01
申请号:CN202410852379.2
申请日:2024-06-28
Applicant: 浙江大学
IPC: G06V10/26 , G06V10/44 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/048 , G06V10/764 , G06V10/25 , G06N3/09 , G06N3/0455
Abstract: 基于通用分割大模型的少样本大坝裂缝分割方法和系统,其方法包括:1)构建大坝裂缝分割数据集;2)训练裂缝图像分割器;3)编码有效提示信息;4)获取裂缝分割掩码。该方法结合传统的分割模型和通用分割大模型SAM的优点,在U‑Net架构的网络模型仅需要通过少量裂缝样本使其获得初步的裂缝识别能力,作为前置的通用裂缝分割器。随后将该训练完成的分割器获取的裂缝信息作为提示信息输入SAM的编码器中,通过编码器过滤无效信息整合有效信息获得提示信息的编码向量,和图像向量一起输入编码器中获取精确的裂缝掩码。本发明的方法克服了目前基于裂缝数据有监督训练的图像分割方法在样本不足的情况下往往难以达到最优效果且鲁棒性不高,进行迁移时效果不佳的问题,利用传统的分割模型和通用分割大模型SAM相结合,获取有效提示信息,提高了大坝裂缝分割方法的准确性、检出率和鲁棒性。
-
公开(公告)号:CN118278468A
公开(公告)日:2024-07-02
申请号:CN202410695887.4
申请日:2024-05-31
Applicant: 浙江大学
IPC: G06N3/0495 , G06N3/082 , G06N3/098 , G06F16/242
Abstract: 本发明公开了一种基于数据库管理系统的深度神经网络推理方法和装置,包括:将预训练神经网络模型参数转换为二进制格式;根据不同的目标任务,使用对应的目标数据集微调将参数已转换为二进制格式的预训练神经网络模型,并在微调中,通过概率模型和剪枝技术,去除冗余参数,得到轻量化模型;将若干个所述轻量化模型部署到数据库管理系统中,即SmartLite;其中,所述预训练神经网络模型的结构和参数作为共享块;当所述SmartLite接受到混合查询请求,至少调用一个模型进行推理;所述混合查询包括SQL查询和深度学习模型推理。本发明计算效率显著提升,使用查找表和比特操作优化,在各种计算任务中显著提高了计算速度。
-
公开(公告)号:CN118227656A
公开(公告)日:2024-06-21
申请号:CN202410650121.4
申请日:2024-05-24
Applicant: 浙江大学
IPC: G06F16/242 , G06F16/2455 , G06F16/27
Abstract: 本发明公开了一种基于数据湖的查询方法和装置,包括:根据用户输入,对查询的目标数据集进行采样,得到模式信息M和数据样本信息,从而构建查询;将查询分解成若干个子任务,从而构建处理图;修正处理图,采用shuffle技术和/或Collapse技术,并结合成本模型对修正后的处理图进行优化;根据优化后的处理图生成代码并执行,以输出用户查询结果。本发明无需中介模式,简化查询过程,不需要数据转换和加载,简化了操作,从整体上提高了查询效率。在查询细节上,设计了针对LLM生成代码的查询优化器,极大提高了LLM生成代码的执行效率和对应方法的可解释性,其中对处理图修正以辅助LLM能提高查询准确性,使整个自然语言查询任务的准确性超过传统方法。
-
公开(公告)号:CN118194705A
公开(公告)日:2024-06-14
申请号:CN202410293647.1
申请日:2024-03-14
Applicant: 浙江大学
Abstract: 构建用于多晶材料塑性行为预测的多任务图网络模型框架的方法和装置,其方法包括如下步骤:1)构建多晶微观结构代表性体积元,利用DREAM.3D软件构建数据集;2)CPFFT模拟单轴拉伸下多晶材料塑性变形,使用开源软件DAMASK来模拟每个微观结构的拉伸变形;3)构建多晶材料塑性行为预测数据集;4)预处理多晶材料数据;5)引入图表示学习框架,通过引注意力残差图神经网络实现多晶材料微观图结构中各个节点和边级特征的处理;6)构建多任务图网络框架,经过图神经网络的特征处理,对节点和边的特征进一步学习;7)优化多任务损失,通过求和权重对不同的任务进行优化上的考量;8)进行单轴拉伸下多晶材料塑性行为预测任务。
-
公开(公告)号:CN117612178A
公开(公告)日:2024-02-27
申请号:CN202311513546.2
申请日:2023-11-14
Applicant: 国网信息通信产业集团有限公司 , 国网山东省电力公司济南供电公司 , 中国电力科学研究院有限公司 , 国网智能电网研究院有限公司 , 浙江大学 , 国网智能科技股份有限公司
Inventor: 张晓航 , 邱镇 , 卢大玮 , 王勇 , 刘晗 , 徐康 , 陈霞 , 梁栋 , 张纪伟 , 王晓辉 , 郭鹏天 , 李黎 , 陈勇 , 周飞 , 张国梁 , 王博 , 宋明黎 , 宋杰 , 王万国 , 袁弘
IPC: G06V30/148 , G06V30/19 , G06V10/82 , G06N3/0455
Abstract: 本申请实施例提供一种文档识别方法及装置,包括:获取文档图像;将文档图像输入预先构建的文档识别模型,由所述文档识别模型输出文档识别结果;其中,所述文档识别模型包括多层编码器、至少两个下采样层、特征金字塔和多层解码器,所述特征金字塔的特征图像包括其中一层编码器输出的第一尺度的特征图像、经过一个下采样层和多层编码器处理输出的第二尺度的特征图像和经过另一个下采样层和多层编码器处理输出的第三尺度的特征图像,所述特征金字塔用于对各特征图像融合处理后生成特征隐向量,多层解码器用于对所述特征隐向量处理后输出词元序列。本申请能够提高从文档图像识别文档内容的准确性。
-
公开(公告)号:CN117475140A
公开(公告)日:2024-01-30
申请号:CN202311537782.8
申请日:2023-11-17
Applicant: 中国电建集团华东勘测设计研究院有限公司 , 浙江大学
IPC: G06V10/25 , G06V10/82 , G06V10/26 , G06V10/764 , G06N3/0442
Abstract: 基于长短期记忆网络的混凝土大坝裂缝检测方法和系统,包括以下步骤:1)图像预处理与切片网格划分;2)切片遍历并找到裂缝首部切片;3)组成裂缝切片序列;4)提取裂缝序列特征并对序列末端切片进行预测5)确定下一个目标裂缝切片的位置。利用裂缝邻域连续切片之间的连续性和方向性,结合LSTM在序列预测上的优势,提高检测精度,减少漏检情况,从而提升整体检测性能。本发明的方法克服了传统方法定位不准确和感受野小的问题,并且利用裂缝的连续性特征,提高了混凝土大坝裂缝检测的准确性和稳定性。
-
公开(公告)号:CN117290408A
公开(公告)日:2023-12-26
申请号:CN202311216746.1
申请日:2023-09-20
Applicant: 浙江大学
IPC: G06F16/2458 , G08G1/01 , G06F16/29 , G06F18/243 , G06N3/094 , G06N3/0455
Abstract: 一种两阶段生成的细粒度车辆轨迹生成方法,包括:步骤1)生成Geohash下的区域转移轨迹:首先对车辆轨迹进行Geohash,找到车辆GPS坐标对应的Geohash编码,从而原始数据中得到在Geohash这种粗粒度下车辆的转移轨迹,之后,使用GAN模型学习不同区域之间的转移规律,从而生成Geohash间转移的连续的轨迹;步骤2)生成基于驾驶意图的细粒度轨迹:根据生成的Geohash区域确定区域内的转移轨迹,预测的粒度为道路之间的转移轨迹,包括对转移轨迹的起始/终止位置进行确定,预测道路节点间的路径。本发明的优点在于,通过两阶段生成的方式,同时考虑整体转移模式和个体驾驶行为,能够实现对个体行为的更加精细化建模,从而提高轨迹生成的准确性和可靠性。
-
公开(公告)号:CN117274219A
公开(公告)日:2023-12-22
申请号:CN202311306252.2
申请日:2023-10-10
Applicant: 浙江大学宁波“五位一体”校区教育发展中心
Abstract: 一种芯片支架外观缺陷检测模板匹配与定位方法和装置,其方法包括:1)对芯片支架模板定义图像,定位产品边缘并对图像进行2D欧几里得变换得到矫正图像;2)对模板定义矫正图像,构建模板组并提取模板组1D指纹;3)对芯片支架检测目标图像,定位产品边缘并对图像进行2D欧几里得变换得到目标矫正对齐图像;4)对目标矫正对齐图像,提取目标1D指纹;5)将模板组1D指纹与目标1D指纹进行匹配,得到模板组偏移量;6)根据模板组偏移量和模板组中模板信息,确定目标矫正对齐图像中匹配的模板信息。本发明实现准确、高效的芯片支架外观检测模板匹配与定位。
-
-
-
-
-
-
-
-
-