-
公开(公告)号:CN118939670A
公开(公告)日:2024-11-12
申请号:CN202411005185.5
申请日:2024-07-25
Applicant: 浙江大学
IPC: G06F16/23 , G06F16/2455
Abstract: 本发明公开了一种自适应调整权重的数据库页面替换方法,本方法使用页面值来表示页面的冷热程度,在替换的过程中根据命中率的变化来选择不同的权重,并在读取时将该权重添加到页面值中,在缓冲区没有空闲页槽时,通过循环遍历所有页槽来找到符合条件的页槽并将该页槽下的页面替换成要读取的页面,从而实现页面替换过程。本发明使用页面值来表示页面的冷热程度,减少了内存空间的消耗;不需要数据结构并发锁,提升了数据库的并发能力,增加了数据库的吞吐量;使用自适应变化的权重来使权重符合当前的负载,从而提高缓冲区的命中率,提高数据库的吞吐量。
-
公开(公告)号:CN117195910A
公开(公告)日:2023-12-08
申请号:CN202311163672.X
申请日:2023-09-11
Applicant: 浙江大学
IPC: G06F40/30 , G06F16/35 , G06F18/214 , G06F18/24 , G06F40/216 , G06F18/22 , G06N3/084
Abstract: 本发明公开了一种基于大模型信息增强的中文医疗同义词判别方法。包括以下步骤:1)将中文医疗数据集中的医学词语进行二分类后得到数据集Ω;2)基于步骤1)构建的数据集Ω利用大模型进行信息增强得到增强数据集T,并生成模型训练数据集;3)构建MedSyn神经网络模型;4)训练MedSyn神经网络模型;5)使用训练好的神经网络模型对样本对中的每对词语进行同义词判别。本发明利用了大模型进行信息增强,将先验知识通过预训练模型的形式引入到MedSyn神经网络模型中,可以利用训练好的神经网络模型对医学词语进行同义词判别。
-
公开(公告)号:CN118674589A
公开(公告)日:2024-09-20
申请号:CN202410777913.8
申请日:2024-06-17
Applicant: 浙江大学
IPC: G06Q50/20 , G06F18/214 , G06F18/21 , G06F16/332 , G06N3/048 , G06N3/045 , G06N3/08
Abstract: 本发明公开了一种基于互信息最大化的跨课程知识追踪方法。该方法旨在通过分析学习者在多个课程中的历史顺序交互来预测他们在课程中的答题表现。主要由三部分构成:第一部分利用层次化知识状态建模来获得学习者在不同粒度级别上的知识状态表示,包括问题集层面和课程层面的知识状态;第二部分设计了跨课程对比学习模块,通过互信息最大化来增强学习者在单课程和跨课程中的知识状态之间的相关性;第三部分引入一种专门针对教育场景设计的混合硬负采样策略,以进一步提高对比学习过程的判别能力。
-
公开(公告)号:CN118035365A
公开(公告)日:2024-05-14
申请号:CN202410248304.3
申请日:2024-03-05
Applicant: 浙江大学计算机创新技术研究院
Abstract: 本发明公开了一种利用关系型数据库管理系统存储多模型数据的方法。本发明方法的步骤包括:1)将多模型数据按属性存储:将多模型数据的各属性转化成若干属性表,第一列代表对象编号,第二列为一个属性;2)遗传算法寻优:使用遗传算法,选择属性表进行聚合,寻找使得查询速度最快的关系模式;3)提高存储效率:将查询速度相近的若干关系模式做比较,选择占用存储最少的关系模式。本发明首次提出了一种利用遗传算法的、将多模型数据存储在关系型数据库管理系统中的方法,本发明方法提升了查询效率并减少了空间消耗,优于现有方法,具有通用、简便等优点。
-
公开(公告)号:CN112506876A
公开(公告)日:2021-03-16
申请号:CN202011362702.6
申请日:2020-11-27
Applicant: 浙江大学计算机创新技术研究院
IPC: G06F16/174 , G06F16/2455 , G06F16/31
Abstract: 本发明公开了一种支持SQL查询的无损压缩查询方法。本发明将文本数据根据预设的分隔符进行分割,分割后的文本数据形成序列集合,利用基于n‑gram(n元语法)的上下文概率模型估计序列集合中各个序列的每个字符的潜在概率分布,获得每个字符的潜在概率分布后对序列集合中各个序列进行压缩,压缩后的序列通过线性扫描的不解压顺序进行多种方式的查询。本发明在保证概率分布的准确性以更好地适应数据分布的变化,并且能够确保编码后的数据支持不解压的查询,提高了查询的效率。
-
公开(公告)号:CN119692426A
公开(公告)日:2025-03-25
申请号:CN202411680163.9
申请日:2024-11-22
Applicant: 浙江大学
IPC: G06N3/096 , G06N3/042 , G06N3/0455 , G06V10/764 , G06V10/82 , G06N3/084
Abstract: 本发明公开了一种基于类别边界不确定性的关系型知识蒸馏方法。1)一张图像同时分别经过两个网络分支的特征编码器得到中间特征图谱,再经解码器得到最后的分割预测图谱;2)基于步骤1)得到的中间特征图谱,计算特征级的一致性蒸馏损失;3)基于步骤1)得到的分割预测图谱,计算像素级的一致性蒸馏损失;4)基于步骤1)得到的双分支的分割预测图谱及其对应的真实类别标签A,分别计算分支1和2的目标损失;5)计算总的优化损失函数;6)基于步骤5)的损失函数训练模型。本发明引入BURKD算法,可以更好地建模样本间和类别间的关系,采用基于类别边界不确定的方法对每一种类别进行适应性的动态加权,提高语义分割的性能。
-
公开(公告)号:CN118861036A
公开(公告)日:2024-10-29
申请号:CN202410972203.0
申请日:2024-07-19
Applicant: 浙江大学
Abstract: 本发明公开了一种基于量子电路的关系表存储方法。本发明利用量子比特和量子门,可以使用少量量子比特,存储大量数据。本发明首先使用一种控制哈达玛门,生成从0开始逐一递增的整数作为主键,再利用主键作为控制位,使用多控制位托佛利门,保存每行的数据。本发明使用量子硬件,实现了关系表的存储,可利用少量量子比特保存大量数据,有利于大数据处理的加速。
-
公开(公告)号:CN118503467A
公开(公告)日:2024-08-16
申请号:CN202410583023.3
申请日:2024-05-11
Applicant: 浙江大学
IPC: G06F16/535 , G06F16/33 , G06F40/284 , G06N3/098
Abstract: 本发明公开了一种联邦学习场景下的个性化图片检索方法。包括:1)加载公开的图片‑文本对数据集生成模型训练数据集;2)基于步骤1)数据集中的文本信息通过tokenizer分词器得到词与Token的位置映射关系;3)基于步骤1)数据集中的图片信息进行预处理得到图片张量;4)基于预训练模型CLIP构建统一模型。5)使用2),3)得到的文本和图像表达训练统一模型;6)使用步骤5)训练好的统一模型进行图像检索,得到与查询文本符合的图片。本发明通过为联邦学习客户端设计私有的检索数据库,对图片和文本融合了特定于客户端的信息,解决了联邦学习场景下数据非独立同分布特点导致的检索精度下降和收敛缓慢问题。
-
公开(公告)号:CN118228734A
公开(公告)日:2024-06-21
申请号:CN202410266524.9
申请日:2024-03-08
Applicant: 浙江大学
Abstract: 本发明公开了一种基于大语言模型做数据增强的医学术语归一化方法。1)将中文医学术语归一化数据集中的数据经过数据清洗得到标准化的原始数据;2)基于步骤1)得到的标准化的原始数据采用大语言模型做数据增强,得到增强数据:3)构建Med‑Term‑Norm神经网络模型;4)训练步骤3)的神经网络模型;5)使用训练好的神经网络模型对输入的提及进行预测,将提及归一化为与之最接近的术语。本发明将大量的先验知识通过大语言模型和预训练模型BERT的形式引入到Med‑Term‑Norm神经网络模型中,解决了词汇缺乏上下文语境的问题;此外,本发明可以利用训练好的神经网络模型对输入的提及进行归一化术语的预测。
-
公开(公告)号:CN112396164A
公开(公告)日:2021-02-23
申请号:CN202011309990.9
申请日:2020-11-20
Applicant: 浙江大学计算机创新技术研究院
Abstract: 本发明公开了一种基于环境敏感智能轨迹预测方法。搜集车辆的轨迹数据并做预处理;选取横坐标和纵坐标范围建立路网区域;根据粒度将路网区域划分为相等的网格;根据粒度,设置网格映射函数,将轨迹数据转换为网格轨迹序列;统计构建获得网格粒度矩阵;构建基于环境敏感的神经网络模型;训练神经网络模型;使用模型预测轨迹进行预测;更新神经网络模型。本发明将路网划分为细粒度的网格,利用神经网络对路网整体情况进行抽象,并将信息加入到轨迹预测模型中,提高了轨迹预测的准确率。
-
-
-
-
-
-
-
-
-