-
公开(公告)号:CN119376934A
公开(公告)日:2025-01-28
申请号:CN202411417066.0
申请日:2024-10-11
Applicant: 浙江大学
IPC: G06F9/50
Abstract: 本发明公开了一种云工作的负载预测方法,包括:获取云工作的历史负载数据并进行预处理,单独标记出每个序列最后一个时间步的数据;使用预处理后的历史负载数据和每个序列最后一个时间步的数据分别训练基于TS2Vec模型的时间卷积编码器,分别得到变量独立预测器和变量依赖预测器,将这两个预测器的输出加权求和得到云工作的负载预测。本发明尽量减少对历史数据的依赖,从而降低训练成本,同时在长期内保持低预测误差,还利用了变量独立和变量依赖两种预测器,进一步提高了预测的准确性。
-
公开(公告)号:CN118861036A
公开(公告)日:2024-10-29
申请号:CN202410972203.0
申请日:2024-07-19
Applicant: 浙江大学
Abstract: 本发明公开了一种基于量子电路的关系表存储方法。本发明利用量子比特和量子门,可以使用少量量子比特,存储大量数据。本发明首先使用一种控制哈达玛门,生成从0开始逐一递增的整数作为主键,再利用主键作为控制位,使用多控制位托佛利门,保存每行的数据。本发明使用量子硬件,实现了关系表的存储,可利用少量量子比特保存大量数据,有利于大数据处理的加速。
-
公开(公告)号:CN118278468B
公开(公告)日:2024-09-06
申请号:CN202410695887.4
申请日:2024-05-31
Applicant: 浙江大学
IPC: G06N3/0495 , G06N3/082 , G06N3/098 , G06F16/242
Abstract: 本发明公开了一种基于数据库管理系统的深度神经网络推理方法和装置,包括:将预训练神经网络模型参数转换为二进制格式;根据不同的目标任务,使用对应的目标数据集微调将参数已转换为二进制格式的预训练神经网络模型,并在微调中,通过概率模型和剪枝技术,去除冗余参数,得到轻量化模型;将若干个所述轻量化模型部署到数据库管理系统中,即SmartLite;其中,所述预训练神经网络模型的结构和参数作为共享块;当所述SmartLite接受到混合查询请求,至少调用一个模型进行推理;所述混合查询包括SQL查询和深度学习模型推理。本发明计算效率显著提升,使用查找表和比特操作优化,在各种计算任务中显著提高了计算速度。
-
公开(公告)号:CN118227656B
公开(公告)日:2024-08-13
申请号:CN202410650121.4
申请日:2024-05-24
Applicant: 浙江大学
IPC: G06F16/242 , G06F16/2455 , G06F16/27
Abstract: 本发明公开了一种基于数据湖的查询方法和装置,包括:根据用户输入,对查询的目标数据集进行采样,得到模式信息M和数据样本信息,从而构建查询;将查询分解成若干个子任务,从而构建处理图;修正处理图,采用shuffle技术和/或Collapse技术,并结合成本模型对修正后的处理图进行优化;根据优化后的处理图生成代码并执行,以输出用户查询结果。本发明无需中介模式,简化查询过程,不需要数据转换和加载,简化了操作,从整体上提高了查询效率。在查询细节上,设计了针对LLM生成代码的查询优化器,极大提高了LLM生成代码的执行效率和对应方法的可解释性,其中对处理图修正以辅助LLM能提高查询准确性,使整个自然语言查询任务的准确性超过传统方法。
-
公开(公告)号:CN117453727A
公开(公告)日:2024-01-26
申请号:CN202311479100.2
申请日:2023-11-08
Applicant: 浙江大学
IPC: G06F16/2453 , G06F16/21 , G06N5/04 , G06F16/2455
Abstract: 本发明公开了一种基于数据库内推理的数据向量化检索方法和装置。传统的图片、文本向量化检索实现往往需要在多个系统内实现,本发明在一个数据库系统内就能直接实现,极大地减轻了系统设计者的难度,极大地减轻了上层应用的开发难度。本发明在数据库内深度学习推理系统的基础上,实现了图片和文本的向量化检索方法,将数据库底层的存储引擎改为向量化存储,实现了图片和文本数据更加轻量的存储,更加高效的检索。通过层次性导航图和向量乘积量化加速向量化处理过程,先在较大数据范围内进行粗略但快速的筛选,再进行较少数据范围内进行精细计算的筛选,极大地提升了图片、文本数据检索方法的性能。
-
公开(公告)号:CN120045583A
公开(公告)日:2025-05-27
申请号:CN202510073091.X
申请日:2025-01-17
Applicant: 浙江大学
IPC: G06F16/2452 , G06F16/242 , G06F18/241 , G06F18/214 , G06N3/045
Abstract: 本发明公开了一种基于认知增强的大语言模型自然语言问题到SQL查询的翻译方法。方法包括先根据数据库中用户提出的自然语言问题依次进行SQL语句处理和合并处理,得到翻译原始数据集,然后对翻译原始数据集依次进行筛选处理、模板处理、增广处理和合并处理,得到翻译数据集,再将翻译数据集输入到关键词预测分类模型中进行训练,得到训练完成的关键词预测分类模型,最终对用户提出的待翻译自然语言问题进行综合处理得到用户提出的待翻译自然语言问题对应的查询结果。本发明实现了优化大语言模型在自然语言问题到SQL查询任务的不同环节的有益效果,取得了增强了大语言模型对自然语言问题到SQL查询任务和SQL语言的理解的优势。
-
公开(公告)号:CN118278468A
公开(公告)日:2024-07-02
申请号:CN202410695887.4
申请日:2024-05-31
Applicant: 浙江大学
IPC: G06N3/0495 , G06N3/082 , G06N3/098 , G06F16/242
Abstract: 本发明公开了一种基于数据库管理系统的深度神经网络推理方法和装置,包括:将预训练神经网络模型参数转换为二进制格式;根据不同的目标任务,使用对应的目标数据集微调将参数已转换为二进制格式的预训练神经网络模型,并在微调中,通过概率模型和剪枝技术,去除冗余参数,得到轻量化模型;将若干个所述轻量化模型部署到数据库管理系统中,即SmartLite;其中,所述预训练神经网络模型的结构和参数作为共享块;当所述SmartLite接受到混合查询请求,至少调用一个模型进行推理;所述混合查询包括SQL查询和深度学习模型推理。本发明计算效率显著提升,使用查找表和比特操作优化,在各种计算任务中显著提高了计算速度。
-
公开(公告)号:CN118227656A
公开(公告)日:2024-06-21
申请号:CN202410650121.4
申请日:2024-05-24
Applicant: 浙江大学
IPC: G06F16/242 , G06F16/2455 , G06F16/27
Abstract: 本发明公开了一种基于数据湖的查询方法和装置,包括:根据用户输入,对查询的目标数据集进行采样,得到模式信息M和数据样本信息,从而构建查询;将查询分解成若干个子任务,从而构建处理图;修正处理图,采用shuffle技术和/或Collapse技术,并结合成本模型对修正后的处理图进行优化;根据优化后的处理图生成代码并执行,以输出用户查询结果。本发明无需中介模式,简化查询过程,不需要数据转换和加载,简化了操作,从整体上提高了查询效率。在查询细节上,设计了针对LLM生成代码的查询优化器,极大提高了LLM生成代码的执行效率和对应方法的可解释性,其中对处理图修正以辅助LLM能提高查询准确性,使整个自然语言查询任务的准确性超过传统方法。
-
公开(公告)号:CN118939670A
公开(公告)日:2024-11-12
申请号:CN202411005185.5
申请日:2024-07-25
Applicant: 浙江大学
IPC: G06F16/23 , G06F16/2455
Abstract: 本发明公开了一种自适应调整权重的数据库页面替换方法,本方法使用页面值来表示页面的冷热程度,在替换的过程中根据命中率的变化来选择不同的权重,并在读取时将该权重添加到页面值中,在缓冲区没有空闲页槽时,通过循环遍历所有页槽来找到符合条件的页槽并将该页槽下的页面替换成要读取的页面,从而实现页面替换过程。本发明使用页面值来表示页面的冷热程度,减少了内存空间的消耗;不需要数据结构并发锁,提升了数据库的并发能力,增加了数据库的吞吐量;使用自适应变化的权重来使权重符合当前的负载,从而提高缓冲区的命中率,提高数据库的吞吐量。
-
公开(公告)号:CN118467369A
公开(公告)日:2024-08-09
申请号:CN202410630222.5
申请日:2024-05-21
Applicant: 浙江大学
IPC: G06F11/36 , G06F16/22 , G06F16/242
Abstract: 本发明公开了一种基于DataCube模型的数据库逻辑缺陷测试方法。本发明首先随机生成测试表,包括维度列和指标列,构建具有丰富边界和极端值的测试数据。接着,运用DataCube模型构建多维数据立方体,模拟实际运算中的边界情况,每个数据正方体包含聚合值与原始数据并通过坐标定位。在生成Query阶段,封装原始DataCube与SQL查询,根据GROUP BY条件对DataCube进行降维聚合,形成与查询匹配的真值。最后,将真值与DBMS执行相同查询的实际结果对比,标识出DBMS在GROUP BY操作中的逻辑缺陷。本发明有效填补了现有技术在分组聚合查询测试的空白,显著提升了测试效率和准确性,有力保障了数据库系统的稳定性和可靠性。
-
-
-
-
-
-
-
-
-