-
公开(公告)号:CN111400395B
公开(公告)日:2023-06-13
申请号:CN202010097438.1
申请日:2020-02-17
Applicant: 浙江大学
Abstract: 本发明公开了一种基于分布式账本的知识图谱众包平台,包括图数据库和关系数据库,其中,所述图数据库用于存储知识图谱,所述关系数据库用于存储审核者和验收者相关信息,知识图谱的审核任务和验收任务;所述知识图谱众包平台执行以下功能:从所述图数据库中选择未审核的主实体及相关的子图形成审核任务,公布到分布式链上;审核者从分布式链上获得审核任务,对主体及相关的子图进行三元组的审核,并返回审核结果公布到分布链上;验收者从分布链上获得验收任务,对审核结果进行审核验收,形成最终三元组存到图数据库;为所述审核任务和验收任务生成荣誉值,并将所述荣誉值公布到链上以供荣誉值转化为货币进行数据交易。
-
公开(公告)号:CN112100392B
公开(公告)日:2022-03-15
申请号:CN202010737376.6
申请日:2020-07-28
Applicant: 浙江大学
Abstract: 本发明公开了一种基于强化学习和知识图谱的故障溯因方法,包括:(1)构建样本实例,编码样本实例,得到包含设备的节点表示、告警信息表示的样本实例表示,根据根因对编码得到根因关系表示;(2)基于强化学习构建策略网络,用于根据环境状态信息确定下一时刻的动作决策;(3)根据设定的时间步长阈值内动作决策结果构建奖励值,利用依据奖励值构建的损失函数更新策略网络参数、节点表示、告警信息表示、根因关系表示;(4)应用时,将实例表示作为策略网络的输入,利用策略网络获得接下来每个时刻里连接的设备节点,依据连接的每个设备节点追溯得到故障设备节点对应的根因设备节点。可以从故障节点开始溯因,通过因果链找到根因节点。
-
公开(公告)号:CN115357728A
公开(公告)日:2022-11-18
申请号:CN202211006989.8
申请日:2022-08-22
Applicant: 浙江大学
Abstract: 本发明公开了一种基于Transformer的大模型知识图谱表示方法,包括:(1)从知识图谱随机采样包含中心三元组的子图,构建掩码子图序列;(2)利用Transformer提取掩码子图序列中节点的嵌入表示,提取时,以邻接矩阵的多维幂次方作为结构信息,并将结构信息的编码向量添加到Transformer的注意力机制中,以得到掩码节点的嵌入表示;(3)利用分类器对掩码节点的嵌入表示进行词义预测,以得到词义预测结果;(4)构建损失函数并优化模型参数;(5)利用参数优化的模型进行知识图谱的补全。该方法能给充分捕获知识图谱中的结构信息以及上下文语义信息。
-
公开(公告)号:CN113468877A
公开(公告)日:2021-10-01
申请号:CN202110777350.9
申请日:2021-07-09
Applicant: 浙江大学
IPC: G06F40/284 , G06N20/00 , G06F16/35
Abstract: 本发明公开了一种语言模型的微调方法、装置、计算设备和存储介质,包括:获取预训练好的语言模型、词组,所述词组包括离散的模板提示词和离散的标签词;设计微调语言模型的输入数据,所述微调输入数据包括文本语句、模板提示词以及遮蔽令牌;根据输入数据和标签词对语言模型进行遮蔽令牌预测任务的有监督学习,以优化语言模型的模型参数。通过弥合预训练的语言模型和微调的语言模型之间的差距,从而使微调的语言模型在下游的遮蔽令牌预测任务上表现更好;全量样本情况下,本方法相对传统微调方法效果较好,在少样本情况下,本方法效果提升更加显著,能够减少大量参数的计算成本,降低计算设备的计算开销。
-
公开(公告)号:CN117493182A
公开(公告)日:2024-02-02
申请号:CN202311441753.1
申请日:2023-11-01
Applicant: 浙江大学
Abstract: 本发明公开了一种无偏见海洋大模型的自动化评测方法和装置,包括:将海洋大模型生成任务划分为15个类别,将海洋科学问题主题划分为5个类别,针对每个类别每个主题下的目标海洋问题,通过构建参考样例、补充专业知识、调整候选答案的位置和生成多个证据链等方式生成多组评分,计算其平均分数作为最终评分,这种平均化过程有助于确保更少偏见的评估。本文的提出的方法能够很好地进行大型语言模型自动化评测,同时能够很好地解决GPT4作为评测模型时存在系统性偏见的问题。在海洋大模型自动化评测场景中具有很好的实用价值。
-
公开(公告)号:CN112100392A
公开(公告)日:2020-12-18
申请号:CN202010737376.6
申请日:2020-07-28
Applicant: 浙江大学
Abstract: 本发明公开了一种基于强化学习和知识图谱的故障溯因方法,包括:(1)构建样本实例,编码样本实例,得到包含设备的节点表示、告警信息表示的样本实例表示,根据根因对编码得到根因关系表示;(2)基于强化学习构建策略网络,用于根据环境状态信息确定下一时刻的动作决策;(3)根据设定的时间步长阈值内动作决策结果构建奖励值,利用依据奖励值构建的损失函数更新策略网络参数、节点表示、告警信息表示、根因关系表示;(4)应用时,将实例表示作为策略网络的输入,利用策略网络获得接下来每个时刻里连接的设备节点,依据连接的每个设备节点追溯得到故障设备节点对应的根因设备节点。可以从故障节点开始溯因,通过因果链找到根因节点。
-
公开(公告)号:CN113987104B
公开(公告)日:2024-06-21
申请号:CN202111142014.3
申请日:2021-09-28
Applicant: 浙江大学
IPC: G06F16/31 , G06F16/25 , G06F40/289 , G06N20/00
Abstract: 本发明公开了一种基于本体指导的生成式事件抽取方法,包括:(1)构建事件本体知识库;(2)设计事件触发词提取模板和事件论元提取模板,分别将输入事件文本映射为第一输入序列,和将融入事件本体的输入事件文本映射为第二输入序列;(3)设计映射多单词标签到事件类型和/或角色类型的类标映射函数;(4)从事件本体知识库中提取与输入事件对应的事件本体后,按照事件触发词提取模板和事件论元提取模板构建第一输入序列和第二输入序列并输入事件提取模型;(5)事件提取模型根据类标映射函数和自身处理机制预测事件类型和角色类型,同时输出事件触发词跨度和事件论元跨度。该方法以实现在全监督和少样本场景下高效地抽取事件结构化知识。
-
公开(公告)号:CN117033653A
公开(公告)日:2023-11-10
申请号:CN202310922506.7
申请日:2023-07-26
Applicant: 浙江大学
IPC: G06F16/36 , G06F40/186 , G06F40/151 , G06N5/04
Abstract: 本发明的目的是提供一种基于代码语言模型的生成式知识图谱构建方法和装置,包括以下步骤:设计结构感知的代码提示模板,代码提示模板包括schema提示模板和文本提示模板;给定包含输入文本和已知知识图谱的样本数据对,采用代码提示模板将样本数据对转换为代码提示,同时将仅包含测试文本的测试数据转换为代码提示;将代码提示的样本数据对和测试数据输入至大型代码语言模型,基于提示学习的方式生成编码三元组的代码,并将代码转换成结构三元组,基于结构三元组构建知识图谱。该方法和装置以代码生成的方式进行关系三元组抽取任务,通过显式地建模结构信息来增强预训练模型,提升模型的结构理解能力,进而提升关系三元组抽取的性能。
-
公开(公告)号:CN115658921A
公开(公告)日:2023-01-31
申请号:CN202211392326.4
申请日:2022-11-08
Applicant: 浙江大学 , 新华融合媒体科技发展(北京)有限公司
IPC: G06F16/36 , G06F16/332 , G06N5/022
Abstract: 本发明公开了一种基于预训练语言模型的开放域科学知识发现方法和装置,构建包括头实体、第一提示语、第二提示语以及尾实体掩码的输入模板;将包含目标关系的每个三元组的头实体、目标关系对应的第一提示语的离散tokens和第二提示语tokens的预训练好的embedding填充输入模板中,并将尾实体掩码处理,形成输入样本数据;为每个目标关系构建单个预训练语言模型,利用目标关系对应的输入样本数据对预训练语言模型进行掩码任务的训练,优化第一提示语和第二提示语的嵌入表示;利用优化的第一提示语和第二提示语的嵌入表示以及预训练语言模型进行三元组中缺失实体的预测,进而能够提升预训练语言模型对知识的发现效率和准确性。
-
公开(公告)号:CN113987104A
公开(公告)日:2022-01-28
申请号:CN202111142014.3
申请日:2021-09-28
Applicant: 浙江大学
IPC: G06F16/31 , G06F16/25 , G06F40/289 , G06N20/00
Abstract: 本发明公开了一种基于本体指导的生成式事件抽取方法,包括:(1)构建事件本体知识库;(2)设计事件触发词提取模板和事件论元提取模板,分别将输入事件文本映射为第一输入序列,和将融入事件本体的输入事件文本映射为第二输入序列;(3)设计映射多单词标签到事件类型和/或角色类型的类标映射函数;(4)从事件本体知识库中提取与输入事件对应的事件本体后,按照事件触发词提取模板和事件论元提取模板构建第一输入序列和第二输入序列并输入事件提取模型;(5)事件提取模型根据类标映射函数和自身处理机制预测事件类型和角色类型,同时输出事件触发词跨度和事件论元跨度。该方法以实现在全监督和少样本场景下高效地抽取事件结构化知识。
-
-
-
-
-
-
-
-
-