基于MySQL存储引擎的融合查询方法

    公开(公告)号:CN101158958A

    公开(公告)日:2008-04-09

    申请号:CN200710156183.6

    申请日:2007-10-23

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于MySQL存储引擎的融合查询方法。利用MySQL数据库的存储引擎插件机制,开发全文检索存储引擎,将现有全文检索系统链接到MySQL数据库中。在MySQL数据库中使用“全文检索链接表”来表示全文检索系统,用户通过标准的SQL访问“全文检索链接表”时,全文检索存储引擎自动将全文检索请求转发至全文检索系统处理。通过“全文检索链接表”与其它表示结构化信息的数据库之间的联接等SQL操作实现融合查询。利用了数据库和全文检索和现有研究和实现成果,基于已有系统可以方便快捷的提供融合查询能力,并且不依赖于一种特有的全文检索系统实现,使用者根据应用需求选择最合适的全文检索系统,提供最好的性能。

    面向检索增强生成系统的错误定位方法、电子设备、介质

    公开(公告)号:CN119474276B

    公开(公告)日:2025-05-13

    申请号:CN202510027118.1

    申请日:2025-01-08

    Applicant: 浙江大学

    Abstract: 本发明公开了一种面向检索增强生成系统的错误定位方法、电子设备、介质,包括:获取检索增强生成系统的中间执行结果,包括:用户问题、原始检索相关文档、模型响应、标准答案;将原始检索相关文档插入第一提示词模板中,输入至第一大语言模型,提取原始检索事实三元组;将所有原始检索事实三元组插入第二提示词模板中,输入至第二大语言模型,判断所有原始检索事实三元组能否推导答案以回答用户问题;若能推导答案,则判定检索增强生成系统中的检索器正常;反之,则判定检索器异常;将用户问题、模型响应、标准答案、原始检索事实三元组输入至第三大语言模型中,判定模型响应的准确完整性,从而判断检索增强生成系统中的大语言模型是否异常。

    一种基于注意力特征信息的BERT模型融合方法

    公开(公告)号:CN114580660B

    公开(公告)日:2025-04-01

    申请号:CN202210176600.8

    申请日:2022-02-25

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于注意力特征信息的BERT模型融合方法,该方法利用每个原模型对输入文本的隐藏表示信息,来计算每个原模型的权重,然后利用每个原模型的权重信息,对原模型的注意力特征信息进行加权融合,最后利用融合后的注意力特征信息对新模型进行调整,提高新模型的表现效果。该方法可以充分利用BERT模型的注意力特征信息,提高融合后BERT模型的表现效果。相比于其他融合方法,本方法可以有效地完善融合后模型的注意力特征信息,使得融合后的模型对文本的注意力特征更加完整,进而提高融合后模型的表现效果。

    一种图像数据多标签分类方法

    公开(公告)号:CN111797911B

    公开(公告)日:2024-02-09

    申请号:CN202010573202.0

    申请日:2020-06-22

    Applicant: 浙江大学

    Abstract: 本发明公开了一种图像数据多标签分类方法,该方法首先构建图片的拓扑关系,然后用基于协作的多标签传播算法(CMLP)来解决半监督多标签学习(SSML)问题,从而获得无标记图片的置信矩阵 本发明能够充分地利用多标签图像数据的多个标签之间的相关性来提升图片的多标签分类预测性能,提高了准确度和鲁棒性,同时能够挖掘无监督图像数据的分布信息,很好地解决半监督多标签学习问题,其性能优于现有的半监督图像数据多标签分类方法。

    一种基于LSM-Tree的KV存储系统、电子设备、介质

    公开(公告)号:CN117349235A

    公开(公告)日:2024-01-05

    申请号:CN202311418655.6

    申请日:2023-10-30

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于LSM‑Tree的KV存储系统、电子设备、介质,包括:易失性内存,用于缓存新写入的数据并查找新写入的数据;持久化内存,包括多布谷鸟过滤器用于索引全局数据;所述多布谷鸟过滤器包括若干个布谷鸟过滤器,每一布谷鸟过滤器中包含由一张哈希表,哈希表表内有若干个哈希桶,每个哈希桶内有4个哈希槽,每个哈希槽的大小为64个字节,其中高32字节用于存储键值对中键的指纹,低32字节用于存储相应键值对所在的文件编号;磁盘,所述磁盘使用单层文件结构以持久化键值对数据,并存储数据日志以及系统日志;其中,单层文件结构基于文件之间的重合度将重合重程度最高的若干个文件在下一轮合并操作中被合并。

    基于声明式推理的协同查询处理方法、系统、电子设备

    公开(公告)号:CN116628136A

    公开(公告)日:2023-08-22

    申请号:CN202310660570.2

    申请日:2023-06-05

    Applicant: 浙江大学

    Abstract: 本发明公开了基于声明式推理的协同查询处理方法、系统、电子设备,包括:步骤S1,将查询文本输入至语法分析器得到语法分析树,进而利用关系代数运算符替换语法分析树中的节点和结构,产生关系代数表达式,并利用代数定律进行等价转化,得到逻辑查询计划;步骤S2,将逻辑查询计划转换为中间查询计划;包括:基于类别约束和精度约束为逻辑查询计划中的DIF查找代价最小的NN模型;步骤S3,将中间查询计划转换成物理查询计划;包括:通过确定实现DIF的NN模型的运行方式为中间查询计划中的每个算子选择实现方式,以获取代价最低的物理查询计划。

    一种激励驱动的链上半异步联邦学习方法

    公开(公告)号:CN116128051A

    公开(公告)日:2023-05-16

    申请号:CN202211393015.X

    申请日:2022-11-08

    Abstract: 本发明公开了一种激励驱动的链上半异步联邦学习方法,该方法提出将联邦学习任务部署在区块链平台上,利用区块链平台所流通的数字货币来奖励对联邦学习做出贡献的参与者,并利用智能合约来实现完全去中心化地协调多参与者协同配合,在不暴露各方数据隐私的前提条件下迭代多轮优化任务所需的全局模型,同时保证联邦学习过程中的信息不被篡改且能够被查询。与传统的联邦学习方法相比,本发明一方面可以吸引更多的参与者持续为联邦学习贡献本地算力和通信资源,另一方面可以提高联邦学习抵抗恶意攻击的能力,防止所训练模型被恶意参与者操控,能够适应于各种在信任难以建立的环境之中的联邦学习。

    一种激励驱动的联邦欺诈防御方法

    公开(公告)号:CN115913685A

    公开(公告)日:2023-04-04

    申请号:CN202211393072.8

    申请日:2022-11-08

    Applicant: 浙江大学

    Abstract: 本发明公开了一种激励驱动的联邦欺诈防御方法,本发明首先提出了激励驱动的联邦欺诈者模型,提出保护隐私与验证信息真实性之间的矛盾。进而,提出了一种激励驱动的联邦欺诈防御方法,确保欺诈者无法满足其目标的激励/花费比值来上报与激励分配相关的本地信息,而不是通过遵守学习规则获得与其本地数据集相关的真实的本地信息,即参与者有较少的经济动机来产生一个编造的本地信息而不是真实的本地信息。实验表明,该防御方法能够有效抵御欺诈者,并且不会给客户和服务器带来过多的传输和计算代价。

    基于决策树的数据库代价模型参数优化方法及其查询方法

    公开(公告)号:CN115576970A

    公开(公告)日:2023-01-06

    申请号:CN202211054493.8

    申请日:2022-08-31

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于决策树的数据库代价模型参数优化方法及其查询方法。针对特定软硬件设置下的数据库实例,本发明建立了一棵数据库代价模型参数树,使用数据库配置参数、查询语句特征作为分裂维度对参数空间进行分区,每个分区中通过对训练样本的线性拟合求解最优的代价模型参数。在运行过程中,参数树为不同参数配置及数据分布下的查询语句分配不同的代价模型参数,从而进行精准的代价预测。实验表明该方法提高了传统基于规则的估计模型的预测准确度,优化了数据库的查询性能。

    一种基于元学习的弱监督图像多标签分类方法

    公开(公告)号:CN113033603B

    公开(公告)日:2022-11-15

    申请号:CN202110162956.1

    申请日:2021-02-05

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于元学习的弱监督图像多标签分类方法,属于图像处理技术领域。该方法为解决因标签缺失无法有效建模标签依赖关系问题,提出一个基于标签信息增强的图像多标签分类模型,采用编码‑解码架构的神经网络,以序列标注的形式,依次判断标签序列中的标签是否相关,获得图像的相关标签。应对弱监督环境存在的监督信息不足导致模型过拟合现象,本发明提出了基于元学习的教师‑学生网络架构训练方法,进一步提高了图像标注的准确率。

Patent Agency Ranking