一种云工作的负载预测方法
    11.
    发明公开

    公开(公告)号:CN119376934A

    公开(公告)日:2025-01-28

    申请号:CN202411417066.0

    申请日:2024-10-11

    Applicant: 浙江大学

    Abstract: 本发明公开了一种云工作的负载预测方法,包括:获取云工作的历史负载数据并进行预处理,单独标记出每个序列最后一个时间步的数据;使用预处理后的历史负载数据和每个序列最后一个时间步的数据分别训练基于TS2Vec模型的时间卷积编码器,分别得到变量独立预测器和变量依赖预测器,将这两个预测器的输出加权求和得到云工作的负载预测。本发明尽量减少对历史数据的依赖,从而降低训练成本,同时在长期内保持低预测误差,还利用了变量独立和变量依赖两种预测器,进一步提高了预测的准确性。

    一种基于残差学习的个性化代码生成系统及方法

    公开(公告)号:CN118733045A

    公开(公告)日:2024-10-01

    申请号:CN202410722876.0

    申请日:2024-06-05

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于残差学习的个性化代码生成系统及方法。1)收集编程语言的代码片段数据集,通过代码检测工具收集得到对应代码片段的风格序列;2)基于步骤1)的代码与其对应的风格序列设置残差项,生成用于残差学习的训练数据;3)为每个代码风格规范设置一个可学习的向量表示;4)通过LLM构建残差学习框架;5)通过步骤4)的残差学习框架进行残差学习得到每个代码风格规范的向量表示;6)通过代码检测工具得到待生成代码的风格序列,使用训练好的代码风格规范的向量表示,生成与历史代码风格一致的个性化代码。本发明通过残差学习到的代码特征进行组合形成开发者的代码风格,并通过代码风格特征指导大语言模型生成个性化代码。

    一种医疗命名实体识别的统一解决方法

    公开(公告)号:CN117057351A

    公开(公告)日:2023-11-14

    申请号:CN202311009614.1

    申请日:2023-08-11

    Applicant: 浙江大学

    Inventor: 戴振龙 姚畅

    Abstract: 本发明公开了一种医疗命名实体识别的统一解决方法。包括:1)将公开的医疗数据集生成模型训练数据集;2)基于步骤1)数据集中的医疗文本信息得到词与Token的位置映射关系;3)对实体进行统一编码,得到编码矩阵;4)构建统一模型;5)通过步骤3)编码矩阵和对应的医疗文本训练统一模型;6)使用步骤4)训练好的统一模型生成医疗文本对应的特征矩阵;7)使用步骤6)得到的特征矩阵以及步骤2)得到的词与Token的位置映射关系进行解码。本发明设计了一种通过特征矩阵来识别平面、重叠(嵌套)和不连续的命名实体的统一编码和解码方案,以此帮助在医疗领域同时识别多种命名实体。

    一种支持SQL查询的无损压缩查询方法

    公开(公告)号:CN112506876B

    公开(公告)日:2022-05-13

    申请号:CN202011362702.6

    申请日:2020-11-27

    Abstract: 本发明公开了一种支持SQL查询的无损压缩查询方法。本发明将文本数据根据预设的分隔符进行分割,分割后的文本数据形成序列集合,利用基于n‑gram(n元语法)的上下文概率模型估计序列集合中各个序列的每个字符的潜在概率分布,获得每个字符的潜在概率分布后对序列集合中各个序列进行压缩,压缩后的序列通过线性扫描的不解压顺序进行多种方式的查询。本发明在保证概率分布的准确性以更好地适应数据分布的变化,并且能够确保编码后的数据支持不解压的查询,提高了查询的效率。

    一种基于大语言模型的通用个性化生成方法

    公开(公告)号:CN118708708A

    公开(公告)日:2024-09-27

    申请号:CN202410722875.6

    申请日:2024-06-05

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于大语言模型的通用个性化生成方法。1)将需要学习的个性化文本数据输入大语言模型的嵌入层得到文本嵌入;2)基于步骤1)的文本嵌入与一组可学习个性化表示与进行拼接得到个性化嵌入;3)基于大语言模型LLM构建个性化生成模型结构,个性化生成模型结构包括LLM层和基于风格适配器的输出层;4)对个性化生成模型进行训练;5)使用步骤4)训练好的个性化生成模型,基于输入文本,续写生成与训练数据风格一致的个性化文本。本发明提供了一种基于大语言模型的通用个性化生成方法。本发明的目的在于设计了一种利用可学习个性化表示的风格适配器,与原有大语言模型的输出层协作,输出与训练数据风格一致的个性化文本。

    基于原型学习的自监督实例自适应的医学图像分割方法

    公开(公告)号:CN118212183A

    公开(公告)日:2024-06-18

    申请号:CN202410266525.3

    申请日:2024-03-08

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于原型学习的自监督实例自适应的医学图像分割方法。1)将公开的三维医学图像分割数据集中的图像经预处理得到标准化的图像;2)将标准化图像输入3Dbackbone;3)通过构建自适应的原型学习模块生成最终的分割预测结果,并通过计算分割损失监督模型;4)通过构建自监督的掩码生成模块生成伪标签;5)构建自监督过滤机制,并引入辅助损失;6)基于分割损失和辅助损失计算整体的目标损失;7)基于步骤6)的损失函数训练模型。本发明引入SMG模块,可以更好地建模类内多样性,设计了自监督过滤机制来对随机初始化的目标查询进行监督;此外,本发明可以还利用IPL模块来针对不同的输入做适应性调整。

    一种融合关系语义信息的医疗文本实体关系联合抽取方法

    公开(公告)号:CN117421387A

    公开(公告)日:2024-01-19

    申请号:CN202311163642.9

    申请日:2023-09-11

    Applicant: 浙江大学

    Inventor: 王孝东 姚畅

    Abstract: 本发明公开了一种融合关系语义信息的医疗文本实体关系联合抽取方法。该方法包括如下步骤:1)对公开的医疗文本数据集中的每条样本进行预处理生成原始的模型训练数据集;2)原始的模型训练数据集存在类别不平衡问题,使用ChatGPT进行数据增强构建新的模型训练数据集;3)构建RelationLinker神经网络模型;4)训练RelationLinker神经网络模型;5)使用训练好的RelationLinker神经网络模型对医学文本进行实体关系抽取;6)使用ChatGPT对抽取的关系三元组进行过滤得到最终结果集。通过本发明方法提升了模型的召回率和准确率。

Patent Agency Ranking