-
公开(公告)号:CN119917733A
公开(公告)日:2025-05-02
申请号:CN202411926432.5
申请日:2024-12-25
Applicant: 浙江工业大学
IPC: G06F16/9535 , G06F18/214 , G06F18/21 , G06F16/2455 , G06Q30/0601 , G06N3/084 , G06N3/0475 , G06N3/042
Abstract: 本发明公开了一种面向推荐系统评测的无数据推荐模型建模方法和装置,所述方法包括:S1:构建生成器G,用以生成虚拟推荐数据;S2:构建克隆模型C,用于学习目标推荐系统的推荐机制;S3:进行协同优化,调整生成器G和克隆模型C的参数;S4:根据评测方案对S3步骤中优化获得的代理模型进行评测。本发明针对无数据推荐系统建模问题利用基于生成器‑代理模型的协同优化框架,有效解决了无数据和模型黑盒难点。
-
公开(公告)号:CN119476195A
公开(公告)日:2025-02-18
申请号:CN202411394370.8
申请日:2024-10-08
Applicant: 浙江工业大学
IPC: G06F30/398 , G06F30/31 , G06F18/214 , G06F18/2433 , G06F18/20 , G06F18/213 , G06F111/20
Abstract: 一种自动化日志解析及特征提取的芯片验证方法和装置,其方法包括:基于UVM的日志数据解析及特征提取,日志收集,获取原始数据并进行预处理,使用机器学习的方法,对特征向量进行学习、基于芯片验证的日志异常检测,根据训练时使用的数据集内各个日志文件的异常类型原因建立模型、基于芯片验证的日志多类型异常诊断、基于增量学习的个性化模型更新。本发明通过在bug的检测及定位领域中,使用半结构化的模拟日志文件为输入,通过日志数据解析及特征提取,日志异常检测,日志多类型异常诊断,个性化模型更新及优化等方面的研究,使验证开发人员能够及时并快速地修复bug,减少人力成本。
-
公开(公告)号:CN119182552A
公开(公告)日:2024-12-24
申请号:CN202411038121.5
申请日:2024-07-31
Applicant: 浙江工业大学
IPC: H04L9/40
Abstract: 一种基于分流策略的增量流量恶意检测方法及系统,其方法包括:S1:采集网络流量并进行预处理;S2:构建基础多分类器,用于实现对当前阶段所见恶意行为的准确识别;S3:通过随机采样策略提取少量样本,作为实现分流策略的基础;S4:训练堆叠模型元分类器;S5:训练新旧数据二元分类器;S6:使用分流策略模型检测网络流量中的恶意流量。本发明将网络流量转化为精简的数据表示,使用多头注意力机制捕获会话流量中数据包间丰富的时空特性,在每个增量步骤训练较高精度的基础多分类模型,并基于此构建基于分流策略的恶意流量检测增量学习模型。
-
公开(公告)号:CN119123343A
公开(公告)日:2024-12-13
申请号:CN202411492368.4
申请日:2024-10-24
Applicant: 浙江工业大学
IPC: F17D5/06
Abstract: 本发明属于分布式光纤传感技术领域,公开了一种分布式光纤传感管道泄漏识别方法。包括以下步骤:步骤1,采用分布式光纤传感器采集供水管道泄漏的振动信息作为原始数据集,原始数据为一维时间序列信号;步骤2,对所述原始数据进行预处理,将预处理后的信号转为频谱图;步骤3,构建改进的MobileNetV3‑large网络模型;步骤4,利用所述训练好的网络模型进行泄漏孔径识别。本发明能够保证计算量小的同时提高分布式光纤传感供水管道泄漏识别的准确率,并提高识别效率。
-
公开(公告)号:CN114927177B
公开(公告)日:2024-06-11
申请号:CN202210592403.4
申请日:2022-05-27
Applicant: 浙江工业大学
IPC: G16H10/00 , G16H70/40 , G06F40/211 , G06F40/242 , G06F40/289 , G06F40/295 , G06F40/30
Abstract: 一种融合中文医疗领域特征的医疗实体识别方法,基于特定领域知识识别药品说明书中的实体,所述方法包括步骤:S1:收集中文药品说明书并进行文本预处理;S2:利用图卷积网络提取文本序列词级别的特征,其中节点的特征考虑了字音、字形以及字典的特征;S3:提取文本序列字级别的特征,并融合词级别的特征;S4:采用双向LSTM学习文本的序列特征,经过解码层得到汉字的序列标签,将标签进行组合,完成实体识别的任务。本发明充分全面地捕捉到汉字字音字形的特征,以词级别的粒度融入到实体识别的模型中,提高了医疗实体识别的精度。
-
公开(公告)号:CN117896129A
公开(公告)日:2024-04-16
申请号:CN202410015441.2
申请日:2024-01-05
Applicant: 浙江工业大学
IPC: H04L9/40 , G06N3/0464 , G06N3/08
Abstract: 一种基于图卷积神经网络的小样本恶意流量检测方法及系统,其方法包括:S1:将采集到的网络流按照五元组进行分割;S2:去除重传包,选取前N个数据包作为一个网络流的表示,对选取的数据包进行填充对齐和匿名化处理,提取IP地址对信息;S3:将网络流构建为交互重现图的图结构数据;S4:基于图卷积神经网络构建孪生网络模型,并训练构建的模型;S5:使用模型检测网络流量中的恶意流量;本发明还包括一种系统,该系统由网络流量采集模块、网络流量处理模块、模型训练模块和恶意流量检测模块构成。本发明将网络流量建模为交互重现图的图结构数据,并使用图卷积神经网络构建捕获其中丰富的结构特性,实现较高精度的检测效果。
-
公开(公告)号:CN117478366A
公开(公告)日:2024-01-30
申请号:CN202311358826.0
申请日:2023-10-19
Applicant: 浙江工业大学
Abstract: 一种联邦学习领域的抵御后门攻击的方法和系统,其方法包括:S1:参与方和服务器通过各自的数据收集方式获取数据;S2:服务器通过自身数据集预训练全局模型若干轮,记录下模型更新量和最终得到的预训练模型,并且使用模型更新量训练一个循环神经网络模型;S3:参与方下载全局模型并且使用自身数据集训练若干轮,并且将更新量上传至服务器;S4:服务器得到的模型更新量与各参与方更新量对比并评分,对双评分加权求和,将汇总评分低于阈值的客户端更新从本轮训练中排除;S5:聚合来自高评分客户端和服务器本地的模型更新得到新一轮的模型更新量,更新全局模型和循环神经网络模型,并且记录模型更新量;S6:重复S3‑S5的过程,直至模型收敛。
-
公开(公告)号:CN117455604A
公开(公告)日:2024-01-26
申请号:CN202311363494.5
申请日:2023-10-20
Applicant: 浙江工业大学
IPC: G06Q30/0601 , G06F16/9535 , G06F16/901 , G06N3/042 , G06N3/045 , G06N3/0464 , G06N3/084
Abstract: 一种基于子图链路预测的异质性优化方法和装置,其方法包括:步骤:基于用户、商品、店铺实体之间的行为或关系抽象构建出模型所需带节点标签的无权无向图;对无权无向图实施目标节点对的封闭子图采样提取;简单控制子图的大小上限,并进行合理的样本过滤;计算每个封闭子图的节点异质性指标;根据计算得到的指标数据,生成新的异质特征向量;将得到的异质特征向量与原节点特征进行替换,成为新的节点特征;提取子图特征,并进行模型训练,最后实现对目标节点对之间连边是否存在的预测;对得到的存在连边的预测结果,获取每位用户的推荐候选名单;对每位用户得到的推荐候选名单,根据预测分数完成排序,得到最终展示给用户的推荐结果。
-
公开(公告)号:CN115391576A
公开(公告)日:2022-11-25
申请号:CN202210836422.7
申请日:2022-07-15
Applicant: 浙江工业大学
IPC: G06F16/45 , G06F16/435 , G06N20/00 , G06N3/04 , G06N3/08
Abstract: 一种基于聚类的联邦图学习方法,基于聚类聚合算法提升数据分布不均匀的图网络参与联邦学习获得的全局模型性能,所述方法包括步骤:S1:客户端通过各自的数据收集方式获取图数据,构建图网络并计算各类标签的结构差异性E,上传至服务器;S2:拥有不同分布数据的客户端在本地进行训练,直至模型收敛,以获得输出层的模型参数aout并上传至服务器。服服务器将客户端上传的两个参数处理后作为划分客户端到不同的聚类簇的依据;S3:各客户端本地训练至一定批次时,上传其模型参数至服务器。服务器通过簇内聚合与簇间聚合更新全局模型参数并发送给各个客户端,客户端更新模型继续下一批次的训练,直至模型收敛。本发明能更好地完成节点分类,链路预测任务。
-
公开(公告)号:CN114927177A
公开(公告)日:2022-08-19
申请号:CN202210592403.4
申请日:2022-05-27
Applicant: 浙江工业大学
IPC: G16H10/00 , G16H70/40 , G06F40/211 , G06F40/242 , G06F40/289 , G06F40/295 , G06F40/30
Abstract: 一种融合中文医疗领域特征的医疗实体识别方法,基于特定领域知识识别药品说明书中的实体,所述方法包括步骤:S1:收集中文药品说明书并进行文本预处理;S2:利用图卷积网络提取文本序列词级别的特征,其中节点的特征考虑了字音、字形以及字典的特征;S3:提取文本序列字级别的特征,并融合词级别的特征;S4:采用双向LSTM学习文本的序列特征,经过解码层得到汉字的序列标签,将标签进行组合,完成实体识别的任务。本发明充分全面地捕捉到汉字字音字形的特征,以词级别的粒度融入到实体识别的模型中,提高了医疗实体识别的精度。
-
-
-
-
-
-
-
-
-