-
公开(公告)号:CN111444316B
公开(公告)日:2023-08-29
申请号:CN202010166812.9
申请日:2020-03-11
Applicant: 浙江大学
IPC: G06F16/33 , G06F16/332 , G06F16/36 , G06N3/0442 , G06N3/045 , G06N3/048 , G06N3/084 , G06N3/092
Abstract: 本发明公开了一种面向知识图谱问答的复合问句解析方法,包括:接收复合问题并获得中心词,作为查询的起点;在解耦器中,将复合问题分解为多个简单问题;在关系检测器中,计算各个简单问题与候选关系的匹配概率,选择概率最大的关系作为该简单问题所属的关系,以中心词为起点、各个简单问题所属的关系为边,在知识图谱中进行匹配,得到复合问题的预测答案;计算复合问题的预测答案与真实答案的损失值,使用优化算法迭代求解直至损失值收敛,得到复合问题的答案。本发明所述的复合问句解析方法结合强化学习的思想,将复合问题分解为简单问题,再通过各个简单问题的答案组合出原始复合问题的答案,提升了智能问答系统在回答复合问题时的表现。
-
公开(公告)号:CN111400395B
公开(公告)日:2023-06-13
申请号:CN202010097438.1
申请日:2020-02-17
Applicant: 浙江大学
Abstract: 本发明公开了一种基于分布式账本的知识图谱众包平台,包括图数据库和关系数据库,其中,所述图数据库用于存储知识图谱,所述关系数据库用于存储审核者和验收者相关信息,知识图谱的审核任务和验收任务;所述知识图谱众包平台执行以下功能:从所述图数据库中选择未审核的主实体及相关的子图形成审核任务,公布到分布式链上;审核者从分布式链上获得审核任务,对主体及相关的子图进行三元组的审核,并返回审核结果公布到分布链上;验收者从分布链上获得验收任务,对审核结果进行审核验收,形成最终三元组存到图数据库;为所述审核任务和验收任务生成荣誉值,并将所述荣誉值公布到链上以供荣誉值转化为货币进行数据交易。
-
公开(公告)号:CN116013418A
公开(公告)日:2023-04-25
申请号:CN202211688943.9
申请日:2022-12-27
Applicant: 浙江大学杭州国际科创中心
Abstract: 本发明公开了一种基于蛋白质预训练场景下的数据筛选方法和装置,包括:获取蛋白质数据,并将每条蛋白质数据表征为三维图结构;利用基于图神经网络的图编码模型对每个三维图结构进行编码得到蛋白质的隐向量;将数据筛选问题建模为最大覆盖率问题,依据每条蛋白质的隐向量与其他蛋白质的隐向量之间的距离来定义样本体积,依据样本体积筛选蛋白质数据。该方法不加入人的干预,端到端地对蛋白质数据进行筛选,通过数据本身的特征指导筛选,保证了筛选的理论合理性和鲁棒性,同时应用场景广泛,在多种数据上都达到最小数据规模和最优表现之间的平衡,将筛选的蛋白质数据直接应用到预训练中,提高了训练效率,同时保证了解决方案的全局最优。
-
公开(公告)号:CN115774999A
公开(公告)日:2023-03-10
申请号:CN202211166219.X
申请日:2022-09-23
Applicant: 浙江大学
IPC: G06F40/295 , G06F17/16 , G06N3/045 , G06N3/09
Abstract: 本发明公开了一种基于关系矩阵的文档级关系抽取方法和装置,包括:对输入文档进行实体序列化,即根据文档级抽取的标注数据按照实体在输入文档中出现的顺序,依次在实体的前后位置插入标记实体位置和ID占位符,得到序列化实体;根据实体出现顺序构造实体级别的关系矩阵,即为关系定义标志符,构建标志符和关系的映射关系,将所有实体的ID占位符按照实体出现顺序均作为关系矩阵的横纵坐标,并将实体之间的关系对应的标志符作为关系矩阵中两实体约束位置的元素值;以关系矩阵作为监督标签,以序列化实体作为样本数据,进行监督学习,以优化文档级关系抽取模型的参数,该方法能够提高文档级关系抽取的效率。
-
公开(公告)号:CN115762657A
公开(公告)日:2023-03-07
申请号:CN202211175637.5
申请日:2022-09-26
Applicant: 浙江大学
IPC: G16C20/30 , G16C20/70 , G06N5/02 , G06N3/045 , G06N3/088 , G06N3/042 , G06N3/0464 , G06N3/047 , G06N3/09
Abstract: 本发明公开了一种基于化学元素知识图谱与官能团提示的分子性质预测方法,包括:收集包括化学元素及其化学属性、官能团及其化学属性的化学知识,依据化学知识构建化学元素知识图谱;根据化学元素知识图谱中的化学元素知识指导原始分子图的增强,以得到分子增强图;根据原始分子图和分子增强图通过对比学习方式预训练图编码器;根据化学元素知识图谱中的官能团知识构建官能团提示,并将该官能团提示添加到输入分子图上,利用添加有官能团提示的输入分子图微调预训练的图编码器和非线性预测器,微调后的图编码器和非线性预测器组成分子性质预测模型;利用分子性质预测模型进行分子性质的预测,该方法提升了分子性质预测的准确性。
-
公开(公告)号:CN115270988A
公开(公告)日:2022-11-01
申请号:CN202210955108.0
申请日:2022-08-10
Applicant: 浙江大学
Abstract: 本发明公开了一种知识表征解耦的分类模型的微调方法、装置和应用,将知识表征与分类模型解耦,存储于知识库中,应用的时候根据检索进行匹配聚合,这样限制了学习模型的死记硬背,提高了模型的泛化能力,同时利用KNN从知识库中检索得到邻近实例短语作为连续的神经示例,利用神经示例指导分类模型训练和纠正分类模型预测,提高了分类模型在少样本和零样本场景下的能力,当数据量足够多时,知识库相应也拥有更佳更丰富的信息,分类模型在全监督场景下表现也十分突出。
-
公开(公告)号:CN112100392B
公开(公告)日:2022-03-15
申请号:CN202010737376.6
申请日:2020-07-28
Applicant: 浙江大学
Abstract: 本发明公开了一种基于强化学习和知识图谱的故障溯因方法,包括:(1)构建样本实例,编码样本实例,得到包含设备的节点表示、告警信息表示的样本实例表示,根据根因对编码得到根因关系表示;(2)基于强化学习构建策略网络,用于根据环境状态信息确定下一时刻的动作决策;(3)根据设定的时间步长阈值内动作决策结果构建奖励值,利用依据奖励值构建的损失函数更新策略网络参数、节点表示、告警信息表示、根因关系表示;(4)应用时,将实例表示作为策略网络的输入,利用策略网络获得接下来每个时刻里连接的设备节点,依据连接的每个设备节点追溯得到故障设备节点对应的根因设备节点。可以从故障节点开始溯因,通过因果链找到根因节点。
-
公开(公告)号:CN112632290B
公开(公告)日:2021-11-09
申请号:CN202011520309.5
申请日:2020-12-21
Applicant: 浙江大学
IPC: G06F16/36 , G06F16/35 , G06F40/30 , G06F40/295 , G06F40/216
Abstract: 本发明公开了一种融合图结构和文本信息的自适应知识图谱表示学习方法,包括:(1)采样目标三元组头、尾实体的邻居三元组;(2)计算每个目标三元组和其头、尾实体的邻居三元组的语义表示;(3)计算目标三元组头、尾实体的结构表示;(4)将目标三元组自身的语义表示与其头、尾实体的结构表示拼接,输入自适应分类层,计算分类结果和分类损失;(5)基于梯度下降的优化算法对上述模块进行优化,直至损失值收敛,得到目标三元组自身的语义表示与其头、尾实体的结构表示的最终拼接结果。本发明能够同时捕捉知识图谱的语义表示和图结构表示,自适应地将语义和结构信息融合并且充分利用,在信息缺乏的知识图谱上表现出更好的鲁棒性。
-
公开(公告)号:CN112668633A
公开(公告)日:2021-04-16
申请号:CN202011561512.7
申请日:2020-12-25
Applicant: 浙江大学
Abstract: 本发明提供了一种基于细粒度领域自适应的图迁移学习方法,包括:(1)采集源域和目标域中的样本,并分别标注源域和目标域中的部分或全部样本,获得带标签的样本;(2)为带标签的样本分别构建源域图和目标域图;(3)将源域图中带标签的样本划分为训练集和验证集,将目标域图中带标签的样本视作测试集;(4)使用源域图的训练集及目标域样本训练图神经网络,得到至少两个参数不同的图神经网络;(5)使用源域图的验证集挑选图神经网络;(6)使用挑选出的图神经网络为目标域的样本预测标签;(7)通过对比目标域中全部带标签样本的真实标签和预测标签,得到评价结果。本发明使图迁移学习时可以从共享节点信息中学习领域无关特征。
-
公开(公告)号:CN112100404A
公开(公告)日:2020-12-18
申请号:CN202010975552.X
申请日:2020-09-16
Applicant: 浙江大学
IPC: G06F16/36
Abstract: 本发明公开了一种基于结构化上下文信息的知识图谱预训练方法,包括:针对目标三元组,构建由上下文三元组组成的实例,采用三元组整合模块对实例的每个上下文三元组进行编码,得到整合向量;将针对实例的所有上下文三元组的整合向量组成上下文向量序列,采用结构化信息模块对上下文向量序列进行编码得到三元组的结构表示向量;采用通用任务模块对三元组的结构表示向量进行计算,得到三元组的标签预测值,基于三元组的标签预测值与标签真值的交叉熵损失来更新三元组的结构表示向量,直到训练结束为止,得到目标三元组的优化后结构表示向量。该方法获得的三元组的结构表示向量结合了上下文信息。
-
-
-
-
-
-
-
-
-