-
公开(公告)号:CN119376934A
公开(公告)日:2025-01-28
申请号:CN202411417066.0
申请日:2024-10-11
Applicant: 浙江大学
IPC: G06F9/50
Abstract: 本发明公开了一种云工作的负载预测方法,包括:获取云工作的历史负载数据并进行预处理,单独标记出每个序列最后一个时间步的数据;使用预处理后的历史负载数据和每个序列最后一个时间步的数据分别训练基于TS2Vec模型的时间卷积编码器,分别得到变量独立预测器和变量依赖预测器,将这两个预测器的输出加权求和得到云工作的负载预测。本发明尽量减少对历史数据的依赖,从而降低训练成本,同时在长期内保持低预测误差,还利用了变量独立和变量依赖两种预测器,进一步提高了预测的准确性。
-
公开(公告)号:CN118733045A
公开(公告)日:2024-10-01
申请号:CN202410722876.0
申请日:2024-06-05
Applicant: 浙江大学
IPC: G06F8/41 , G06F18/214
Abstract: 本发明公开了一种基于残差学习的个性化代码生成系统及方法。1)收集编程语言的代码片段数据集,通过代码检测工具收集得到对应代码片段的风格序列;2)基于步骤1)的代码与其对应的风格序列设置残差项,生成用于残差学习的训练数据;3)为每个代码风格规范设置一个可学习的向量表示;4)通过LLM构建残差学习框架;5)通过步骤4)的残差学习框架进行残差学习得到每个代码风格规范的向量表示;6)通过代码检测工具得到待生成代码的风格序列,使用训练好的代码风格规范的向量表示,生成与历史代码风格一致的个性化代码。本发明通过残差学习到的代码特征进行组合形成开发者的代码风格,并通过代码风格特征指导大语言模型生成个性化代码。
-
公开(公告)号:CN117057351A
公开(公告)日:2023-11-14
申请号:CN202311009614.1
申请日:2023-08-11
Applicant: 浙江大学
IPC: G06F40/295 , G06F40/289 , G06F40/126 , G06F18/214 , G06F18/2415 , G06F16/35 , G06N3/045 , G06N3/084
Abstract: 本发明公开了一种医疗命名实体识别的统一解决方法。包括:1)将公开的医疗数据集生成模型训练数据集;2)基于步骤1)数据集中的医疗文本信息得到词与Token的位置映射关系;3)对实体进行统一编码,得到编码矩阵;4)构建统一模型;5)通过步骤3)编码矩阵和对应的医疗文本训练统一模型;6)使用步骤4)训练好的统一模型生成医疗文本对应的特征矩阵;7)使用步骤6)得到的特征矩阵以及步骤2)得到的词与Token的位置映射关系进行解码。本发明设计了一种通过特征矩阵来识别平面、重叠(嵌套)和不连续的命名实体的统一编码和解码方案,以此帮助在医疗领域同时识别多种命名实体。
-
公开(公告)号:CN112506876B
公开(公告)日:2022-05-13
申请号:CN202011362702.6
申请日:2020-11-27
Applicant: 浙江大学计算机创新技术研究院
IPC: G06F16/174 , G06F16/2455 , G06F16/31
Abstract: 本发明公开了一种支持SQL查询的无损压缩查询方法。本发明将文本数据根据预设的分隔符进行分割,分割后的文本数据形成序列集合,利用基于n‑gram(n元语法)的上下文概率模型估计序列集合中各个序列的每个字符的潜在概率分布,获得每个字符的潜在概率分布后对序列集合中各个序列进行压缩,压缩后的序列通过线性扫描的不解压顺序进行多种方式的查询。本发明在保证概率分布的准确性以更好地适应数据分布的变化,并且能够确保编码后的数据支持不解压的查询,提高了查询的效率。
-
公开(公告)号:CN112380400A
公开(公告)日:2021-02-19
申请号:CN202011309993.2
申请日:2020-11-20
Applicant: 浙江大学计算机创新技术研究院
IPC: G06F16/901 , G06F16/906 , G06F16/909
Abstract: 本发明公开了一种基于后缀树误差有界的轨迹预测方法。历史轨迹输入到深度学习模型中进行处理获得预测轨迹,将历史轨迹存储到后缀树中,当有新的预测请求时,在后缀树中找到相似的轨迹作为预测结果,由后缀树直接返回预测结果。本发明能在后缀树中找到相似轨迹,由后缀树直接返回预测结果,无需进入神经网络进行预测,极大提高了轨迹预测的效率。
-
公开(公告)号:CN119693638A
公开(公告)日:2025-03-25
申请号:CN202411680170.9
申请日:2024-11-22
Applicant: 浙江大学
IPC: G06V10/26 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/084
Abstract: 本发明公开了一种基于语义先验引导的不完整多模态脑肿瘤分割方法。本发明基于互学习蒸馏框架构建SMML网络模型,在每个分支引入MedSAM‑3D模型提供先验的语义引导;本发明设计的方向性的像素级的蒸馏算法可以使双分支网络互相交换学习到的有价值的知识,进一步对网络参数进行优化;这二者的结合使模型在脑肿瘤数据集上实现了SOTA的效果,超越了目前已有的其他模型,获得了最好的分割效果,实现了目前的SOTA。
-
公开(公告)号:CN118708708A
公开(公告)日:2024-09-27
申请号:CN202410722875.6
申请日:2024-06-05
Applicant: 浙江大学
IPC: G06F16/335 , G06F18/2415 , G06F18/214
Abstract: 本发明公开了一种基于大语言模型的通用个性化生成方法。1)将需要学习的个性化文本数据输入大语言模型的嵌入层得到文本嵌入;2)基于步骤1)的文本嵌入与一组可学习个性化表示与进行拼接得到个性化嵌入;3)基于大语言模型LLM构建个性化生成模型结构,个性化生成模型结构包括LLM层和基于风格适配器的输出层;4)对个性化生成模型进行训练;5)使用步骤4)训练好的个性化生成模型,基于输入文本,续写生成与训练数据风格一致的个性化文本。本发明提供了一种基于大语言模型的通用个性化生成方法。本发明的目的在于设计了一种利用可学习个性化表示的风格适配器,与原有大语言模型的输出层协作,输出与训练数据风格一致的个性化文本。
-
公开(公告)号:CN118212183A
公开(公告)日:2024-06-18
申请号:CN202410266525.3
申请日:2024-03-08
Applicant: 浙江大学
IPC: G06T7/00 , G06T7/10 , G06V10/762 , G06V10/764 , G06V10/80 , G06F17/16 , G06N3/0455 , G06N3/048 , G06N3/0895
Abstract: 本发明公开了一种基于原型学习的自监督实例自适应的医学图像分割方法。1)将公开的三维医学图像分割数据集中的图像经预处理得到标准化的图像;2)将标准化图像输入3Dbackbone;3)通过构建自适应的原型学习模块生成最终的分割预测结果,并通过计算分割损失监督模型;4)通过构建自监督的掩码生成模块生成伪标签;5)构建自监督过滤机制,并引入辅助损失;6)基于分割损失和辅助损失计算整体的目标损失;7)基于步骤6)的损失函数训练模型。本发明引入SMG模块,可以更好地建模类内多样性,设计了自监督过滤机制来对随机初始化的目标查询进行监督;此外,本发明可以还利用IPL模块来针对不同的输入做适应性调整。
-
公开(公告)号:CN117421387A
公开(公告)日:2024-01-19
申请号:CN202311163642.9
申请日:2023-09-11
Applicant: 浙江大学
IPC: G06F16/31 , G06F40/289 , G06F40/30 , G06N3/084
Abstract: 本发明公开了一种融合关系语义信息的医疗文本实体关系联合抽取方法。该方法包括如下步骤:1)对公开的医疗文本数据集中的每条样本进行预处理生成原始的模型训练数据集;2)原始的模型训练数据集存在类别不平衡问题,使用ChatGPT进行数据增强构建新的模型训练数据集;3)构建RelationLinker神经网络模型;4)训练RelationLinker神经网络模型;5)使用训练好的RelationLinker神经网络模型对医学文本进行实体关系抽取;6)使用ChatGPT对抽取的关系三元组进行过滤得到最终结果集。通过本发明方法提升了模型的召回率和准确率。
-
公开(公告)号:CN112395467A
公开(公告)日:2021-02-23
申请号:CN202011362738.4
申请日:2020-11-27
Applicant: 浙江大学计算机创新技术研究院
IPC: G06F16/901 , G06F16/909 , G06F16/29
Abstract: 本发明公开了一种基于时隙的时空索引方法。根据运动对象的轨迹,构建TS‑TPR索引结构,将实时获得的预测轨迹插入到TS‑TPR中对应的TPR树中;批量更新TS‑TPR索引结构中的轨迹数据;以分而治之方式使用TS‑TPR回答预测性时空查询。通过本发明的索引能索引预测轨迹,可以索引连续轨迹,完成有关的预测性查询,提升了预测性查询的准确率。
-
-
-
-
-
-
-
-
-