一种基于长尾数据分布的文档级关系抽取方法

    公开(公告)号:CN114861645A

    公开(公告)日:2022-08-05

    申请号:CN202210469592.6

    申请日:2022-04-28

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于长尾数据分布的文档级关系抽取方法,属于信息抽取和机器学习领域。包括文档预处理、文档编码、关系编码、数据增广和关系预测。在数据增广方面,本发明针对带标签的三元向量组集合,随机选取或者预设需要进行增广的关系类型,设计掩码向量,对待进行数据增广的原始三元向量组中的池化上下文表示进行扰动,生成新的三元向量组;可以有效提升文档级关系抽取模型预测尾部关系类型的准确率。同时,相比于传统的基于文本的数据增广方法,本发明不需要进行额外的文本编码过程,提高了模型训练的计算效率。此外,本发明提出的基于数据增广的对比学习预训练框架,能够在长尾数据分布场景下有效提升文档级关系抽取的准确率。

    一种面向跨模态检索的数据采集处理方法及系统

    公开(公告)号:CN114611618A

    公开(公告)日:2022-06-10

    申请号:CN202210260897.6

    申请日:2022-03-16

    Applicant: 浙江大学

    Abstract: 本发明公开了一种面向跨模态检索的数据采集处理方法和系统,包括:对目标开源数据网络进行分布式并行采集多模态数据;对文本模态数据进行特殊字符和不可见字符的清洗后,对清洗后的文本模态数据与图像模态数据进行不同消息队列存储;利用特征提取模型分别对消息队列中的每条文本和每个图像进行特征提取得到文本特征和图像特征,根据文本特征和图像特征的相似度匹配筛选得到图‑文组合,并以图‑文组合的图像特征和文本特征作为索引进行数据库存储;检索时,依据上传数据与数据库中的图‑文组合的相似度筛选匹配的图‑文组合作为上传数据的检索结果并返回,该方法和系统能够实现图片‑文本数据进行高质量的跨模态检索。

    面向亚类疾病的医学图像识别增强方法

    公开(公告)号:CN112381818B

    公开(公告)日:2022-04-29

    申请号:CN202011407961.6

    申请日:2020-12-03

    Applicant: 浙江大学

    Inventor: 郑晓雨 纪守领

    Abstract: 本发明公开了一种面向亚类疾病的医学图像识别增强方法,包括:利用预训练好的嵌入特征提取单元提取输入医学图像的嵌入特征;利用训练好的三个通道特征提取单元分别从嵌入特征中提取共同激活特征、背景噪声特征以及核心特征;所述共同激活特征、背景噪声特征以及核心特征作为一个整体组成再分配特征输入至预训练好的分类器中,经过分类器预测计算,输出用于识别正常图像或异常图像的分类结果。该方法能够实现对医学图像进行增强识别,识别医学图像是正常图像还是异常图像。

    基于主特征增强的图像中毒防御方法、装置及其应用

    公开(公告)号:CN113902954A

    公开(公告)日:2022-01-07

    申请号:CN202111084309.X

    申请日:2021-09-15

    Abstract: 本发明公开了一种基于主特征增强的图像中毒防御方法、装置及其应用,方法包括:获取图像数据集;选取中毒攻击方法对图像样本进行下毒操作并对深度学习模型进行训练,获得中毒深度学习模型;基于特征神经通路获得主特征增强样本,构成主特征图像数据集;采用原始的图像数据集、主特征图像数据集以及对应的类标对中毒深度学习模型进行训练,获得增加防御机制后的深度学习模型;将中毒样本输入到增加防御机制后的深度学习模型中,统计中毒样本的标签变化率;迭代直至标签变化率大于或等于设定阈值,则获得最终的具有防御机制的深度学习模型。本发明的方法与深度学习采用的模型无关,并且适用于其他多种策略,不影响模型的正常功能的使用。

    基于多种对抗样例攻击的智能防御算法推荐方法及系统

    公开(公告)号:CN108549940B

    公开(公告)日:2021-10-29

    申请号:CN201810180928.0

    申请日:2018-03-05

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于多种对抗样例攻击的智能防御算法推荐方法,包括以下步骤:对原始数据集进行清洗,得到训练集;利用训练集训练目标识别模型,得到目标攻击模型;选取不同的对抗样例攻击算法,攻击目标攻击模型;量化评估每种对抗样例攻击算法的攻击成功率,根据攻击成功率选择目标攻击算法;针对每种目标攻击算法,逐一应用对抗攻击防御算法进行防御;根据防御结果向用户推荐相应的对抗攻击防御算法。本发明还公开了智能防御算法推荐方法所采用的智能防御算法推荐系统。针对具体的目标模型,本发明的智能防御算法推荐系统可以智能的推荐有效的防御算法,从而减小对抗样例攻击给目标模型造成的损失。

    一种社交网络假流量黑灰产自动挖掘方法和系统

    公开(公告)号:CN113486243A

    公开(公告)日:2021-10-08

    申请号:CN202110791106.8

    申请日:2021-07-13

    Applicant: 浙江大学

    Abstract: 本发明公开了一种社交网络假流量黑灰产自动挖掘方法和系统,包括:(1)创建“蜜罐”用户,在社交网络中对参与假流量攻击的恶意用户进行诱捕;(2)提取恶意用户的微博内容层面的特征;(3)提取恶意用户的个人信息层面的特征;(4)在社交网络中随机选取正常用户并分别提取微博内容层面和个人信息层面的特征;(5)运用机器学习算法,根据提取的特征训练分类器;(6)分别提取目标用户的微博内容层面和个人信息层面的特征,并运用训练好的分类器进行识别;(7)对于被识别为恶意用户的目标用户,基于规则对该用户所发的微博进行筛选,挖掘出涉及假流量黑灰产的微博。本发明的方法和系统可及时发现、预警和治理社交网络流量作弊事件。

    一种基于多阶对抗特征学习的组合查询图像检索方法

    公开(公告)号:CN112818157A

    公开(公告)日:2021-05-18

    申请号:CN202110185641.9

    申请日:2021-02-10

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于多阶对抗特征学习的组合查询图像检索方法,该方法包括:首先通过预训练的特征提取模块获取图像特征和利用LSTM网络获取文本特征,然后通过自注意力的指导将两种模态的特征融合。并且,将低阶特征通过双线性融合的方式生成高阶特征。再利用三元组损失学习特征之间的相似关系,利用判别器与检索网络对抗进一步促进特征间的融合,最后结合二者通过端到端的方式训练模型,从而实现高效的组合查询图像检索。本发明利用了深度学习技术和借鉴了博弈的思想,很大程度上提高了组合查询图像检索的性能和效率。

    面向亚类疾病的医学图像识别增强方法

    公开(公告)号:CN112381818A

    公开(公告)日:2021-02-19

    申请号:CN202011407961.6

    申请日:2020-12-03

    Applicant: 浙江大学

    Inventor: 郑晓雨 纪守领

    Abstract: 本发明公开了一种面向亚类疾病的医学图像识别增强方法,包括:利用预训练好的嵌入特征提取单元提取输入医学图像的嵌入特征;利用训练好的三个通道特征提取单元分别从嵌入特征中提取共同激活特征、背景噪声特征以及核心特征;所述共同激活特征、背景噪声特征以及核心特征作为一个整体组成再分配特征输入至预训练好的分类器中,经过分类器预测计算,输出用于识别正常图像或异常图像的分类结果。该方法能够实现对医学图像进行增强识别,识别医学图像是正常图像还是异常图像。

    网络小额贷款服务中的黑中介自动挖掘方法与系统

    公开(公告)号:CN112241760A

    公开(公告)日:2021-01-19

    申请号:CN202010867838.6

    申请日:2020-08-25

    Applicant: 浙江大学

    Abstract: 本发明公开了一种网络小额贷款服务中的黑中介自动挖掘方法与系统,该方法包括:基于该规则识别出更多的高精度中介用户S1;对种子黑中介用户B1、普通中介用户C1以及普通用户N1的申贷信息进行特征提取并分析,找到可以有效区分三类用户的属性特征;利用分类模型训练出一个可以从普通用户中识别中介用户的中介用户分类模型;从高精度中介用户S1中找到一批高精度的黑中介用户B2;利用分类算法训练出一个可以从中介用户中识别黑中介用户的分类模型,识别出更多的黑中介用户B4;种子黑中介用户B1、黑中介用户B2以及黑中介用户B4组成网贷平台中的黑中介用户群体。本发明的方法与系统,能有效识别申贷用户中的黑中介用户群体。

    基于SGX软件防护扩展指令的工控白名单管理系统及方法

    公开(公告)号:CN110222485B

    公开(公告)日:2021-01-12

    申请号:CN201910400840.X

    申请日:2019-05-14

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于SGX软件防护扩展指令的工控白名单管理系统及方法,系统包括:SGX加密模块,基于SGX生成可信空间和可信空间的访问密钥;可信空间用于存储白名单数据及运行白名单管理模块、身份认证模块;查询处理模块,对工控监测系统发出的白名单数据查询请求消息发送给白名单管理模块;更新处理模块,对系统管理员发出的白名单更新请求消息发送给身份认证模块;身份认证模块,运行于可信空间内,对系统管理员进行身份信息验证;白名单管理模块,运行于可信空间内,维护可信空间内的白名单数据,并执行相应的查询与更新操作。本发明的工控白名单管理系统可避免工控白名单数据不被恶意篡改。

Patent Agency Ranking