-
公开(公告)号:CN119474276A
公开(公告)日:2025-02-18
申请号:CN202510027118.1
申请日:2025-01-08
Applicant: 浙江大学
IPC: G06F16/332 , G06F16/33 , G06N5/04 , G06N5/022
Abstract: 本发明公开了一种面向检索增强生成系统的错误定位方法、电子设备、介质,包括:获取检索增强生成系统的中间执行结果,包括:用户问题、原始检索相关文档、模型响应、标准答案;将原始检索相关文档插入第一提示词模板中,输入至第一大语言模型,提取原始检索事实三元组;将所有原始检索事实三元组插入第二提示词模板中,输入至第二大语言模型,判断所有原始检索事实三元组能否推导答案以回答用户问题;若能推导答案,则判定检索增强生成系统中的检索器正常;反之,则判定检索器异常;将用户问题、模型响应、标准答案、原始检索事实三元组输入至第三大语言模型中,判定模型响应的准确完整性,从而判断检索增强生成系统中的大语言模型是否异常。
-
公开(公告)号:CN117675344A
公开(公告)日:2024-03-08
申请号:CN202311658001.0
申请日:2023-12-05
Applicant: 浙江大学
Abstract: 本发明公开了一种针对梯度放大攻击的防御方法、电子设备、介质,所述方法包括:服务器获取每一参与者上传的本地模型梯度,并计算每一本地模型梯度的L2值,得到L2值集合L2(N);根据L2值集合L2(N)设置检验阈值;根据检验阈值对每一本地模型梯度的L2值进行检验,当本地模型梯度的L2值小于检验阈值时,通过检验;基于通过检验的本地模型梯度更新全局模型。本发明方法通过检验模型梯度的二范数值来识别欺诈者,能够有效地抵制恶意参与者的梯度放大攻击行为。
-
公开(公告)号:CN116431915A
公开(公告)日:2023-07-14
申请号:CN202310398860.4
申请日:2023-04-06
Applicant: 浙江大学
IPC: G06F16/9535 , G06Q30/0601 , G06N20/00 , G06N3/098 , G06N3/048 , G06N3/047 , G06F21/62
Abstract: 本发明实施例提供了一种基于联邦学习和注意力机制的跨域推荐方法与装置,包括:获取用户的源域特征向量;在各个客户端上分别构建跨域推荐模型,根据源域特征向量获取用户的领域共享特征,根据用户的标识、商品的标识分别获取用户的领域特定特征和商品特征向量;对领域共享特征和领域特定特征进行聚合,得到混合特征向量;基于混合特征向量与商品特征向量进行推荐预测,得到用户对商品的偏好概率;基于联邦学习机制,训练所有客户端上的跨域推荐模型。本发明保障用户特征可以从源域准确迁移到目标域,又考虑了用户在不同领域偏好的多样性,从而提高推荐预测的准确率。
-
公开(公告)号:CN113032391B
公开(公告)日:2022-04-12
申请号:CN202110162264.7
申请日:2021-02-05
Applicant: 浙江大学
IPC: G06F16/22 , G06F16/2455
Abstract: 本发明公开了一种分布式子轨迹连接查询处理方法。该方法首先将轨迹数据进行混合分区处理,即首先基于时间信息对轨迹数据进行时间分区,之后基于空间位置信息将同一时间分区内的轨迹数据进行空间分区;在每一个时间分区内建立索引;在之后的查询过程中,首先将查询轨迹按照相同的时间间隔进行分区,并在相应的时间分区内进行并行查询,得到一系列候选轨迹;之后将每个候选轨迹对应的空间分区数据加载到内存中,并一一进行验证;最后将各个时间分区得到的数据进行合并。本方法能够支持城市级别GPS点的查询,并能够有效降低I/O和CPU处理开销,加快查询处理,性能良好。
-
公开(公告)号:CN111881222B
公开(公告)日:2022-04-12
申请号:CN202010686608.X
申请日:2020-07-16
Applicant: 浙江大学
IPC: G06F16/28 , G06F16/2458
Abstract: 本发明公开了一种面向审计的关系数据库聚合代数约束自动挖掘方法,它是一种智慧审计应用中潜藏于海量数据之中的约束关系挖掘方法。现有的审计规则或由专家构造,或由数据库约束发现方法产生,能实现审计简单业务的目的,但是不足以应付海量数据规模挑战,无法满足审计作业中含统计数值的复杂运算的需求。本发明针对上述不足,将该需求形式化成聚合代数约束,并提供聚合代数约束的挖掘方法,该方法根据数据库的模式信息依次枚举表连接、分组方式和代数表达式,计算分析后得到聚合代数约束。本发明无需人工参与约束挖掘,可以应对计算海量数据带来的时空性能挑战,满足审计统计数值相关的复杂运算需求。
-
公开(公告)号:CN111259938B
公开(公告)日:2022-04-12
申请号:CN202010023677.2
申请日:2020-01-09
Applicant: 浙江大学
IPC: G06V10/764 , G06K9/62
Abstract: 本发明公开了一种基于流形学习和梯度提升模型的图片偏多标签分类方法。从训练数据集构建一个加权图,通过求解以上第一最小化模型获得非负权重矩阵,根据加权图建立第二最小化模型并求解获得重构标签矩阵,根据重构标签矩阵将训练数据集换构造并训练二值相关模型,预测得标签矩阵;对图片的特征向量矩阵建立回归器最小化求解,用迭代预测结果矩阵增强特征向量矩阵,结合负梯度矩阵构造数据集并训练学习获得弱回归器,求和所有弱回归器,得最终回归器,对预待测图片处理判断。本发明能够充分地利用图片偏多标签数据之间的相关性来提升图片的多标签分类预测性能,可实现偏标签数据的消歧,提高了准确度和鲁棒性,其性能优于现有的图片偏多标签方法。
-
公开(公告)号:CN113033203A
公开(公告)日:2021-06-25
申请号:CN202110162263.2
申请日:2021-02-05
Applicant: 浙江大学
IPC: G06F40/295 , G06F16/36 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种面向医药说明书文本的结构化信息抽取方法,属于医疗自然语言处理技术领域。首先,采用一种面向无标注数据的基于对抗迁移学习的实体识别模型,进行医药说明书文本的初步实体识别。接着,在实体识别基础上,提出一种用法用量表抽取新任务,即将用法用量文本中复杂的知识结构以表格的形式抽取出来。并针对此任务,设计一种基于特征融合的表抽取算法,来进行说明书用法用量的表抽取。最后,在实体识别的基础上,采用一种基于医疗实体字符注意力机制的关系抽取方法,来对实体之间的关系进行抽取。本发明提出的结构化信息抽取方法可以解决医药说明书文本的复杂信息抽取问题。
-
公开(公告)号:CN113032418A
公开(公告)日:2021-06-25
申请号:CN202110183393.4
申请日:2021-02-08
Applicant: 浙江大学
IPC: G06F16/242 , G06F16/245
Abstract: 本发明公开了一种基于树状模型的复杂自然语言查询转SQL方法,该方法首先针对于输入的数据库进行预筛选,获取与自然语言查询相关的TOP K个表格,将多表查询转化为单表查询,并适配于数据库规模较大从而无法将信息输入到自然语言查询转SQL模型的情况;然后针对于复杂的SQL语句自顶向下地拆解为多叉树形式,每个结点代表一个模块,由此构建了一个树状模型来预测复杂SQL语句各模块的输出;最后针对于SQL语句值抽取的任务,将值抽取从树状模型中分离出来,共享权重来同时抽取SQL中不同子句的值。本发明的基于树状模型的复杂自然语言查询转SQL方法框架可以解决自然语言查询转SQL任务中的多表复杂查询问题。
-
公开(公告)号:CN107480220B
公开(公告)日:2021-01-12
申请号:CN201710647283.2
申请日:2017-08-01
Applicant: 浙江大学
IPC: G06F16/332 , G06F16/338
Abstract: 本发明公开了一种基于在线聚集的快速文本查询方法。首先以规定的数据模式读取文本文件;其次,以在线聚集的方式进行输入查询,所有查询以树的方式进行组织;最后,根据不同的聚合函数,计算相应的查询置信度或置信区间,当置信度或置信区间满足预设的临界值时,查询过程停止。本发明能在超大文本数据上直接进行查询,并且快速地获得近似结果,实现了在超大文本数据上快速的查询响应。
-
公开(公告)号:CN111475500A
公开(公告)日:2020-07-31
申请号:CN202010279614.3
申请日:2020-04-10
Applicant: 浙江大学
IPC: G06F16/215
Abstract: 本发明公开了一种自动发现审计规则和异常数据的方法。该方法先将审计的数据集按照属性类型分成分类属性和数值属性,用户再分别给定分类属性的最小支持率和数值属性的偏移率,然后在分类属性中选出支持率高于最小支持率的候选分类属性和属性值;再根据属性类型生成候选属性集,从而获取审计规则;最后根据获取的审计规则,依次对收集的审计数据集进行筛选,选出符合审计规则中满足条件约束的,而派生属性的属性值不在正常值范围内的数据,即为异常数据。该自动发现审计规则和异常数据方法能够有效地提高审计效率,降低审计成本。
-
-
-
-
-
-
-
-
-