-
公开(公告)号:CN119474276A
公开(公告)日:2025-02-18
申请号:CN202510027118.1
申请日:2025-01-08
Applicant: 浙江大学
IPC: G06F16/332 , G06F16/33 , G06N5/04 , G06N5/022
Abstract: 本发明公开了一种面向检索增强生成系统的错误定位方法、电子设备、介质,包括:获取检索增强生成系统的中间执行结果,包括:用户问题、原始检索相关文档、模型响应、标准答案;将原始检索相关文档插入第一提示词模板中,输入至第一大语言模型,提取原始检索事实三元组;将所有原始检索事实三元组插入第二提示词模板中,输入至第二大语言模型,判断所有原始检索事实三元组能否推导答案以回答用户问题;若能推导答案,则判定检索增强生成系统中的检索器正常;反之,则判定检索器异常;将用户问题、模型响应、标准答案、原始检索事实三元组输入至第三大语言模型中,判定模型响应的准确完整性,从而判断检索增强生成系统中的大语言模型是否异常。
-
公开(公告)号:CN117675344A
公开(公告)日:2024-03-08
申请号:CN202311658001.0
申请日:2023-12-05
Applicant: 浙江大学
Abstract: 本发明公开了一种针对梯度放大攻击的防御方法、电子设备、介质,所述方法包括:服务器获取每一参与者上传的本地模型梯度,并计算每一本地模型梯度的L2值,得到L2值集合L2(N);根据L2值集合L2(N)设置检验阈值;根据检验阈值对每一本地模型梯度的L2值进行检验,当本地模型梯度的L2值小于检验阈值时,通过检验;基于通过检验的本地模型梯度更新全局模型。本发明方法通过检验模型梯度的二范数值来识别欺诈者,能够有效地抵制恶意参与者的梯度放大攻击行为。
-
公开(公告)号:CN116431915A
公开(公告)日:2023-07-14
申请号:CN202310398860.4
申请日:2023-04-06
Applicant: 浙江大学
IPC: G06F16/9535 , G06Q30/0601 , G06N20/00 , G06N3/098 , G06N3/048 , G06N3/047 , G06F21/62
Abstract: 本发明实施例提供了一种基于联邦学习和注意力机制的跨域推荐方法与装置,包括:获取用户的源域特征向量;在各个客户端上分别构建跨域推荐模型,根据源域特征向量获取用户的领域共享特征,根据用户的标识、商品的标识分别获取用户的领域特定特征和商品特征向量;对领域共享特征和领域特定特征进行聚合,得到混合特征向量;基于混合特征向量与商品特征向量进行推荐预测,得到用户对商品的偏好概率;基于联邦学习机制,训练所有客户端上的跨域推荐模型。本发明保障用户特征可以从源域准确迁移到目标域,又考虑了用户在不同领域偏好的多样性,从而提高推荐预测的准确率。
-
公开(公告)号:CN110727695B
公开(公告)日:2022-05-03
申请号:CN201910936345.0
申请日:2019-09-29
Applicant: 浙江大学
IPC: G06F16/245 , G06F40/30 , G06F40/289 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种面向新型供电城轨列车数据运维的自然语言查询解析方法。新型供电城轨列车运行时采集获得的运维数据存储于数据库中,组建一条运维数据的训练样本;对运维数据的自然语言查询和字段进行嵌入处理;将两组输入向量结合各自的标签输入到各自的不同神经网络模型中进行训练;将待测试的自然语言查询语句处理成输入向量,通过训练后的两个不同神经网络模型映射到,对结构化查询语句的不同分类部分进行预测输出,预测后再组合合并成完整的预测结果。本发明利用了数据库已存储的大规模数据扩充训练样本,在获取成本低、存储代价小、使用效率高的基础上,丰富了模型学习到的语义信息,提升了对结构化查询语句的预测准确率。
-
公开(公告)号:CN113032391B
公开(公告)日:2022-04-12
申请号:CN202110162264.7
申请日:2021-02-05
Applicant: 浙江大学
IPC: G06F16/22 , G06F16/2455
Abstract: 本发明公开了一种分布式子轨迹连接查询处理方法。该方法首先将轨迹数据进行混合分区处理,即首先基于时间信息对轨迹数据进行时间分区,之后基于空间位置信息将同一时间分区内的轨迹数据进行空间分区;在每一个时间分区内建立索引;在之后的查询过程中,首先将查询轨迹按照相同的时间间隔进行分区,并在相应的时间分区内进行并行查询,得到一系列候选轨迹;之后将每个候选轨迹对应的空间分区数据加载到内存中,并一一进行验证;最后将各个时间分区得到的数据进行合并。本方法能够支持城市级别GPS点的查询,并能够有效降低I/O和CPU处理开销,加快查询处理,性能良好。
-
公开(公告)号:CN111881222B
公开(公告)日:2022-04-12
申请号:CN202010686608.X
申请日:2020-07-16
Applicant: 浙江大学
IPC: G06F16/28 , G06F16/2458
Abstract: 本发明公开了一种面向审计的关系数据库聚合代数约束自动挖掘方法,它是一种智慧审计应用中潜藏于海量数据之中的约束关系挖掘方法。现有的审计规则或由专家构造,或由数据库约束发现方法产生,能实现审计简单业务的目的,但是不足以应付海量数据规模挑战,无法满足审计作业中含统计数值的复杂运算的需求。本发明针对上述不足,将该需求形式化成聚合代数约束,并提供聚合代数约束的挖掘方法,该方法根据数据库的模式信息依次枚举表连接、分组方式和代数表达式,计算分析后得到聚合代数约束。本发明无需人工参与约束挖掘,可以应对计算海量数据带来的时空性能挑战,满足审计统计数值相关的复杂运算需求。
-
公开(公告)号:CN111259938B
公开(公告)日:2022-04-12
申请号:CN202010023677.2
申请日:2020-01-09
Applicant: 浙江大学
IPC: G06V10/764 , G06K9/62
Abstract: 本发明公开了一种基于流形学习和梯度提升模型的图片偏多标签分类方法。从训练数据集构建一个加权图,通过求解以上第一最小化模型获得非负权重矩阵,根据加权图建立第二最小化模型并求解获得重构标签矩阵,根据重构标签矩阵将训练数据集换构造并训练二值相关模型,预测得标签矩阵;对图片的特征向量矩阵建立回归器最小化求解,用迭代预测结果矩阵增强特征向量矩阵,结合负梯度矩阵构造数据集并训练学习获得弱回归器,求和所有弱回归器,得最终回归器,对预待测图片处理判断。本发明能够充分地利用图片偏多标签数据之间的相关性来提升图片的多标签分类预测性能,可实现偏标签数据的消歧,提高了准确度和鲁棒性,其性能优于现有的图片偏多标签方法。
-
公开(公告)号:CN110647524B
公开(公告)日:2021-11-23
申请号:CN201910934906.3
申请日:2019-09-29
Applicant: 浙江大学
IPC: G06F16/215 , G06F16/23 , G06F16/2458 , G06F16/901
Abstract: 本发明公开了一种新型供电轨道交通运维系统的数据库补全方法。首先,数据库采用链接预测进行发现,识别数据库中异常关系和未知关系;随后通过计算节点关系元组的置信度;最后,判断加入数据库中,使得轨道交通运维数据库更加完整。本发明方法在面对专业领域数据库补全问题上具有完整性、可控性,提升了精度。
-
公开(公告)号:CN112405606B
公开(公告)日:2021-09-28
申请号:CN202011227439.X
申请日:2020-11-05
Applicant: 浙江大学
Abstract: 本发明公开了一种带机械锁定功能的五自由度分时驱动助力机械臂,包括关节一、关节二、关节三和中央分时驱动机构,中央分时驱动机构包括中央分时驱动机构接头、中央分时驱动机构电机、中央分时驱动机构减速器、中央机架、丝杠摩擦轮和分时驱动机构安装法兰体,中央分时驱动机构减速器的输出端连接中央分时驱动机构减速器输出轴,中央分时驱动机构减速器输出轴可带动中央机架或丝杠摩擦轮旋转,丝杠摩擦轮旋转带动分时驱动机构安装法兰体做直线运动。本发明减轻相同自由度下与静态负载刚度情况下机械臂的自重,减小人体在背负外肢体协作机械臂时的负担。
-
公开(公告)号:CN113033203A
公开(公告)日:2021-06-25
申请号:CN202110162263.2
申请日:2021-02-05
Applicant: 浙江大学
IPC: G06F40/295 , G06F16/36 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种面向医药说明书文本的结构化信息抽取方法,属于医疗自然语言处理技术领域。首先,采用一种面向无标注数据的基于对抗迁移学习的实体识别模型,进行医药说明书文本的初步实体识别。接着,在实体识别基础上,提出一种用法用量表抽取新任务,即将用法用量文本中复杂的知识结构以表格的形式抽取出来。并针对此任务,设计一种基于特征融合的表抽取算法,来进行说明书用法用量的表抽取。最后,在实体识别的基础上,采用一种基于医疗实体字符注意力机制的关系抽取方法,来对实体之间的关系进行抽取。本发明提出的结构化信息抽取方法可以解决医药说明书文本的复杂信息抽取问题。
-
-
-
-
-
-
-
-
-