-
公开(公告)号:CN119151016B
公开(公告)日:2025-05-13
申请号:CN202411650247.8
申请日:2024-11-19
Applicant: 杭州高新区(滨江)区块链与数据安全研究院 , 浙江大学
IPC: G06N20/00 , G06N3/006 , G06F16/242
Abstract: 本申请涉及一种多智能体代理的数据库内的机器学习特征生成方法,包括:根据历史特征集合在数据库内的机器学习模型中的性能指标,确定第一特征集合和第一特征集合的特征描述;根据机器学习任务和历史特征集合,得到第一特征集合对应的特征提示;获取数据库内的大语言模型根据第一特征集合、特征描述和特征提示生成的新特征,并结合第一特征集合和新特征得到第二特征集合;根据历史特征集合和第二特征集合在机器学习模型中的性能指标,确定第三特征集合;分解第三特征集合,直至分解得到的特征集合与第三特征集合匹配,根据分解结果得到执行机器学习任务所需的第四特征集合。采用本方法能够解决数据库内执行机器学习任务困难且准确性低的问题。
-
公开(公告)号:CN119536983A
公开(公告)日:2025-02-28
申请号:CN202411345113.5
申请日:2024-09-25
Applicant: 杭州高新区(滨江)区块链与数据安全研究院 , 浙江大学
IPC: G06F9/50 , G06F21/71 , G06F21/62 , G06N3/0499 , G06N3/084
Abstract: 本申请涉及一种异构系统的模型并行训练方法、装置和计算机设备,其中,该方法包括:在每个预设条件下,构建待训练模型与各计算设备之间的多种映射关系,并生成策略集合;预设条件包括训练数据的批次大小、待训练模型对应的流水线并行粒度和每个计算设备的预设显存预算;遍历各预设条件,通过动态规划算法对不同的映射关系和策略集合中的各候选策略进行处理,得到当前最优的模型并行训练策略下异构系统的执行成本;基于最小执行成本对应的模型并行训练策略,通过各计算设备执行模型训练。通过本申请,解决了采用固定处理器进行训练,无法利用异构系统中多个计算设备实现高效的并行训练的问题,实现高效的模型并行训练,提升计算设备的资源利用率。
-
公开(公告)号:CN119398289A
公开(公告)日:2025-02-07
申请号:CN202411268070.5
申请日:2024-09-10
Applicant: 杭州高新区(滨江)区块链与数据安全研究院 , 浙江大学
IPC: G06Q10/047 , G06N5/022 , G06N3/063 , G06N10/20
Abstract: 本申请涉及一种基于混合量子算法的路径优化方法、装置、计算机设备和存储介质,其中,该方法包括:获取待优化路径的无向完全加权图的权重邻接矩阵;将权重邻接矩阵输入到预设的量子电路中进行优化,得到第一候选解和对应的第一权重;其中,在量子电路的编码与剪枝的优化过程中,将所有候选解划分为多个步骤;将旅行商在每个步骤中的选择,编码到量子电路中,执行相应的剪枝,以形成包含所有候选解的均匀叠加态;根据第一权重和预设的第一阈值,更新第一候选解,得到目标路径。通过本申请,解决了相关技术中路径规划的效率低下的问题,有效减少编码候选解所需的量子资源,实现在精确规划路径的同时,能够提高路径规划效率。
-
公开(公告)号:CN119376934A
公开(公告)日:2025-01-28
申请号:CN202411417066.0
申请日:2024-10-11
Applicant: 浙江大学
IPC: G06F9/50
Abstract: 本发明公开了一种云工作的负载预测方法,包括:获取云工作的历史负载数据并进行预处理,单独标记出每个序列最后一个时间步的数据;使用预处理后的历史负载数据和每个序列最后一个时间步的数据分别训练基于TS2Vec模型的时间卷积编码器,分别得到变量独立预测器和变量依赖预测器,将这两个预测器的输出加权求和得到云工作的负载预测。本发明尽量减少对历史数据的依赖,从而降低训练成本,同时在长期内保持低预测误差,还利用了变量独立和变量依赖两种预测器,进一步提高了预测的准确性。
-
公开(公告)号:CN118733045A
公开(公告)日:2024-10-01
申请号:CN202410722876.0
申请日:2024-06-05
Applicant: 浙江大学
IPC: G06F8/41 , G06F18/214
Abstract: 本发明公开了一种基于残差学习的个性化代码生成系统及方法。1)收集编程语言的代码片段数据集,通过代码检测工具收集得到对应代码片段的风格序列;2)基于步骤1)的代码与其对应的风格序列设置残差项,生成用于残差学习的训练数据;3)为每个代码风格规范设置一个可学习的向量表示;4)通过LLM构建残差学习框架;5)通过步骤4)的残差学习框架进行残差学习得到每个代码风格规范的向量表示;6)通过代码检测工具得到待生成代码的风格序列,使用训练好的代码风格规范的向量表示,生成与历史代码风格一致的个性化代码。本发明通过残差学习到的代码特征进行组合形成开发者的代码风格,并通过代码风格特征指导大语言模型生成个性化代码。
-
公开(公告)号:CN117057351A
公开(公告)日:2023-11-14
申请号:CN202311009614.1
申请日:2023-08-11
Applicant: 浙江大学
IPC: G06F40/295 , G06F40/289 , G06F40/126 , G06F18/214 , G06F18/2415 , G06F16/35 , G06N3/045 , G06N3/084
Abstract: 本发明公开了一种医疗命名实体识别的统一解决方法。包括:1)将公开的医疗数据集生成模型训练数据集;2)基于步骤1)数据集中的医疗文本信息得到词与Token的位置映射关系;3)对实体进行统一编码,得到编码矩阵;4)构建统一模型;5)通过步骤3)编码矩阵和对应的医疗文本训练统一模型;6)使用步骤4)训练好的统一模型生成医疗文本对应的特征矩阵;7)使用步骤6)得到的特征矩阵以及步骤2)得到的词与Token的位置映射关系进行解码。本发明设计了一种通过特征矩阵来识别平面、重叠(嵌套)和不连续的命名实体的统一编码和解码方案,以此帮助在医疗领域同时识别多种命名实体。
-
公开(公告)号:CN112506876B
公开(公告)日:2022-05-13
申请号:CN202011362702.6
申请日:2020-11-27
Applicant: 浙江大学计算机创新技术研究院
IPC: G06F16/174 , G06F16/2455 , G06F16/31
Abstract: 本发明公开了一种支持SQL查询的无损压缩查询方法。本发明将文本数据根据预设的分隔符进行分割,分割后的文本数据形成序列集合,利用基于n‑gram(n元语法)的上下文概率模型估计序列集合中各个序列的每个字符的潜在概率分布,获得每个字符的潜在概率分布后对序列集合中各个序列进行压缩,压缩后的序列通过线性扫描的不解压顺序进行多种方式的查询。本发明在保证概率分布的准确性以更好地适应数据分布的变化,并且能够确保编码后的数据支持不解压的查询,提高了查询的效率。
-
公开(公告)号:CN112380400A
公开(公告)日:2021-02-19
申请号:CN202011309993.2
申请日:2020-11-20
Applicant: 浙江大学计算机创新技术研究院
IPC: G06F16/901 , G06F16/906 , G06F16/909
Abstract: 本发明公开了一种基于后缀树误差有界的轨迹预测方法。历史轨迹输入到深度学习模型中进行处理获得预测轨迹,将历史轨迹存储到后缀树中,当有新的预测请求时,在后缀树中找到相似的轨迹作为预测结果,由后缀树直接返回预测结果。本发明能在后缀树中找到相似轨迹,由后缀树直接返回预测结果,无需进入神经网络进行预测,极大提高了轨迹预测的效率。
-
公开(公告)号:CN119693638A
公开(公告)日:2025-03-25
申请号:CN202411680170.9
申请日:2024-11-22
Applicant: 浙江大学
IPC: G06V10/26 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/084
Abstract: 本发明公开了一种基于语义先验引导的不完整多模态脑肿瘤分割方法。本发明基于互学习蒸馏框架构建SMML网络模型,在每个分支引入MedSAM‑3D模型提供先验的语义引导;本发明设计的方向性的像素级的蒸馏算法可以使双分支网络互相交换学习到的有价值的知识,进一步对网络参数进行优化;这二者的结合使模型在脑肿瘤数据集上实现了SOTA的效果,超越了目前已有的其他模型,获得了最好的分割效果,实现了目前的SOTA。
-
公开(公告)号:CN118708708A
公开(公告)日:2024-09-27
申请号:CN202410722875.6
申请日:2024-06-05
Applicant: 浙江大学
IPC: G06F16/335 , G06F18/2415 , G06F18/214
Abstract: 本发明公开了一种基于大语言模型的通用个性化生成方法。1)将需要学习的个性化文本数据输入大语言模型的嵌入层得到文本嵌入;2)基于步骤1)的文本嵌入与一组可学习个性化表示与进行拼接得到个性化嵌入;3)基于大语言模型LLM构建个性化生成模型结构,个性化生成模型结构包括LLM层和基于风格适配器的输出层;4)对个性化生成模型进行训练;5)使用步骤4)训练好的个性化生成模型,基于输入文本,续写生成与训练数据风格一致的个性化文本。本发明提供了一种基于大语言模型的通用个性化生成方法。本发明的目的在于设计了一种利用可学习个性化表示的风格适配器,与原有大语言模型的输出层协作,输出与训练数据风格一致的个性化文本。
-
-
-
-
-
-
-
-
-