-
公开(公告)号:CN119597469A
公开(公告)日:2025-03-11
申请号:CN202411656715.2
申请日:2024-11-19
Applicant: 杭州高新区(滨江)区块链与数据安全研究院 , 浙江大学
IPC: G06F9/50 , G06N3/084 , G06T1/20 , G06N3/0499
Abstract: 本申请涉及一种资源受限的大模型异构训练方法、计算机设备和存储介质,方法包括:在图像处理器进行模型前向传播时生成的激活量中,根据与各激活量对应的计算量之间的依赖关系和/或各激活量的计算量与存储量确定第一激活量,并将第一激活量异步传输至中央处理器;在模型反向传播过程中从中央处理器加载第一激活量至图像处理器;获取图像处理器基于第一激活量计算得到模型参数的梯度,将梯度异步传输至中央处理器;确定中央处理器中基于梯度更新得到的优化器,并获取更新后的优化器调整得到的模型参数,将模型参数异步传输至图像处理器。采用本方法能够解决显存资源受限的大模型训练困难且显卡计算效率低的问题。
-
公开(公告)号:CN119377270A
公开(公告)日:2025-01-28
申请号:CN202411266464.7
申请日:2024-09-10
Applicant: 杭州高新区(滨江)区块链与数据安全研究院 , 浙江大学
IPC: G06F16/2455 , G06F16/242 , G06F16/2458 , G06F16/248 , G06F16/2453
Abstract: 本申请涉及一种基于数据编码的含有代理模型的推理查询方法及装置。所述方法包括:获取查询数据,所述查询数据包括查询文本以及查询函数数据;基于所述查询文本确定文本编码,以及基于所述查询函数数据确定查询参数编码;基于所述文本编码以及所述查询参数编码,确定查询数据编码;将所述查询数据编码输入查询时间预测模型,输出查询预测时间,再基于所述查询预测时间以及预设查询计划算法确定查询结果,其中,所述查询时间预测模型基于多个查询时间预测样本训练得到,所述查询时间预测样本基于预设查询计划算法以及历史查询数据确定。本申请能够有效提高查询效率。
-
公开(公告)号:CN119151016A
公开(公告)日:2024-12-17
申请号:CN202411650247.8
申请日:2024-11-19
Applicant: 杭州高新区(滨江)区块链与数据安全研究院 , 浙江大学
IPC: G06N20/00 , G06N3/006 , G06F16/242
Abstract: 本申请涉及一种多智能体代理的数据库内的机器学习特征生成方法,包括:根据历史特征集合在数据库内的机器学习模型中的性能指标,确定第一特征集合和第一特征集合的特征描述;根据机器学习任务和历史特征集合,得到第一特征集合对应的特征提示;获取数据库内的大语言模型根据第一特征集合、特征描述和特征提示生成的新特征,并结合第一特征集合和新特征得到第二特征集合;根据历史特征集合和第二特征集合在机器学习模型中的性能指标,确定第三特征集合;分解第三特征集合,直至分解得到的特征集合与第三特征集合匹配,根据分解结果得到执行机器学习任务所需的第四特征集合。采用本方法能够解决数据库内执行机器学习任务困难且准确性低的问题。
-
公开(公告)号:CN119149588A
公开(公告)日:2024-12-17
申请号:CN202411639951.3
申请日:2024-11-18
Applicant: 杭州高新区(滨江)区块链与数据安全研究院 , 浙江大学
IPC: G06F16/2453 , G06N5/04
Abstract: 本申请涉及一种面向代理模型的推理查询重优化方法、装置、设备和介质,通过基于第一查询计划,将当前批次数据输入至推理模型进行处理,得到所需查询的数据;其中,推理模型包括代理模型和机器学习模型;在执行第一查询计划的过程中,监测统计信息;其中,统计信息包括系统资源或者查询计划选择率;在监测到统计信息的变化超出阈值的情况下,基于第二查询计划,将历史数据输入至代理模型进行重训练;其中,历史数据包括在当前批次数据之前输入至推理模型处理后携带上标签的数据;减小了重优化推理查询方法产生的计算开销,提升了重优化效率。
-
公开(公告)号:CN118939670A
公开(公告)日:2024-11-12
申请号:CN202411005185.5
申请日:2024-07-25
Applicant: 浙江大学
IPC: G06F16/23 , G06F16/2455
Abstract: 本发明公开了一种自适应调整权重的数据库页面替换方法,本方法使用页面值来表示页面的冷热程度,在替换的过程中根据命中率的变化来选择不同的权重,并在读取时将该权重添加到页面值中,在缓冲区没有空闲页槽时,通过循环遍历所有页槽来找到符合条件的页槽并将该页槽下的页面替换成要读取的页面,从而实现页面替换过程。本发明使用页面值来表示页面的冷热程度,减少了内存空间的消耗;不需要数据结构并发锁,提升了数据库的并发能力,增加了数据库的吞吐量;使用自适应变化的权重来使权重符合当前的负载,从而提高缓冲区的命中率,提高数据库的吞吐量。
-
公开(公告)号:CN118245485B
公开(公告)日:2024-08-23
申请号:CN202410645067.4
申请日:2024-05-23
Applicant: 浙江大学
IPC: G06F16/22 , G06F16/242 , G06F40/177 , G06F40/151
Abstract: 本发明公开了一种大模型处理表格数据的方法、装置及介质,包括:将用户的自然语言转化为SQL查询,以进行表格数据查询请求;将SQL查询中的表格任务解析成对应的算子,以生成粗粒度的计算图;使用算子分解、算子组合、算子重排,并结合代价函数对粗粒度的计算图进行优化,生成细粒度的计算图;根据细粒度的计算图编译成代码;执行所述代码,得到用户答复。本发明能够实现与表格的自然语言交互,能够实现提取信息、计算、推理等功能,具备更强的理解和执行表格任务的能力。
-
公开(公告)号:CN118245485A
公开(公告)日:2024-06-25
申请号:CN202410645067.4
申请日:2024-05-23
Applicant: 浙江大学
IPC: G06F16/22 , G06F16/242 , G06F40/177 , G06F40/151
Abstract: 本发明公开了一种大模型处理表格数据的方法、装置及介质,包括:将用户的自然语言转化为SQL查询,以进行表格数据查询请求;将SQL查询中的表格任务解析成对应的算子,以生成粗粒度的计算图;使用算子分解、算子组合、算子重排,并结合代价函数对粗粒度的计算图进行优化,生成细粒度的计算图;根据细粒度的计算图编译成代码;执行所述代码,得到用户答复。本发明能够实现与表格的自然语言交互,能够实现提取信息、计算、推理等功能,具备更强的理解和执行表格任务的能力。
-
公开(公告)号:CN119862210A
公开(公告)日:2025-04-22
申请号:CN202510347551.3
申请日:2025-03-24
Applicant: 浙江大学 , 杭州高新区(滨江)区块链与数据安全研究院
IPC: G06F16/2453 , G06F16/22 , G06F16/2455 , G06F16/248 , G06F40/30
Abstract: 本发明公开了一种基于动态查询编译缓存优化的数据库查询执行方法和装置,属于数据库管理系统领域。接收用户输入的查询语句并构建抽象语法树;根据抽象语法树生成对应的标识符,查找匹配的机器代码,加载并执行能被复用的匹配的机器代码得到执行结果;对没有查找到匹配的机器代码的用户输入的查询语句或匹配的机器代码不能被复用的用户输入的查询语句生成对应的可执行计划树,通过动态编译生成机器代码并优化,得到优化后的机器代码并加载和执行得到执行结果;随后将执行结果发送给用户,并定期清理缓存中的机器代码。本发明精准决定是否复用缓存中的机器代码,从而减少不必要的编译开销,提高查询执行效率。
-
公开(公告)号:CN119598509A
公开(公告)日:2025-03-11
申请号:CN202411650255.2
申请日:2024-11-19
Applicant: 杭州高新区(滨江)区块链与数据安全研究院 , 浙江大学
IPC: G06F21/62 , H04L9/00 , G06N3/0455 , G06N3/084 , G06N3/0499 , G06F18/214
Abstract: 本申请涉及一种基于拆分学习的私有化大模型微调训练方法和装置,其中,该方法包括:将预训练的大模型拆分成头部模型段、中间模型段以及尾部模型段;将原始数据拆分成隐私数据和非隐私数据;根据隐私数据和非隐私数据,协同训练客户端中的头部模型段和尾部模型段,及服务器中的第一中间模型段和第二中间模型段,得到目标大模型;其中,在协同训练过程中,同态加密客户端和服务器之间传输的与隐私数据相关的隐私中间激活量;目标大模型输出关于特定主题的文档答复。通过本申请,解决了相关技术中需要向服务器传输中间激活量,存在通过模型反演攻击推测或恢复原始数据的风险的问题;实现对隐私数据的保护,降低隐私数据泄露的风险。
-
公开(公告)号:CN119151016B
公开(公告)日:2025-05-13
申请号:CN202411650247.8
申请日:2024-11-19
Applicant: 杭州高新区(滨江)区块链与数据安全研究院 , 浙江大学
IPC: G06N20/00 , G06N3/006 , G06F16/242
Abstract: 本申请涉及一种多智能体代理的数据库内的机器学习特征生成方法,包括:根据历史特征集合在数据库内的机器学习模型中的性能指标,确定第一特征集合和第一特征集合的特征描述;根据机器学习任务和历史特征集合,得到第一特征集合对应的特征提示;获取数据库内的大语言模型根据第一特征集合、特征描述和特征提示生成的新特征,并结合第一特征集合和新特征得到第二特征集合;根据历史特征集合和第二特征集合在机器学习模型中的性能指标,确定第三特征集合;分解第三特征集合,直至分解得到的特征集合与第三特征集合匹配,根据分解结果得到执行机器学习任务所需的第四特征集合。采用本方法能够解决数据库内执行机器学习任务困难且准确性低的问题。
-
-
-
-
-
-
-
-
-