-
公开(公告)号:CN114298042B
公开(公告)日:2024-10-15
申请号:CN202111444208.9
申请日:2021-11-30
Applicant: 清华大学
IPC: G06F40/295 , G06F40/30 , G06N5/02 , G06N3/0895 , G06N3/0985 , G06N3/084 , G06N3/0455
Abstract: 本发明提供一种实体链接方法、实体链接模型训练方法及电子设备,方法通过获取文本中的待链接实体;将待链接实体输入至实体链接模型,获取实体链接模型输出的待链接实体与知识库中各实体的匹配分值;其中,实体链接模型是基于第一预设数量的弱监督数据样本、第二预设数量的真实数据样本和预先确定的实体标签训练后得到的,真实数据样本用于通过元学习规则调整弱监督数据样本的权重为目标训练权重,弱监督数据样本和真实数据样本均包括实体名称样本、实体提及样本和实体提及的上下文样本,第一预设数量大于第二预设数量;将待链接实体链接至知识库中匹配分值最高的实体,通过少量的真实数据样本提高实体链接模型的精确度,更准确的实现了实体链接。
-
公开(公告)号:CN112148883B
公开(公告)日:2024-09-10
申请号:CN201910583845.0
申请日:2019-06-29
IPC: G06F16/36
Abstract: 本申请实施例公开了一种知识图谱的嵌入表示方法及相关设备,所述方法包括:可以从预设的知识库中获取目标知识图谱的M个实体中每个实体的N个相关实体,以及每个相关实体对应的K个概念;接着确定每个实体与该实体的每个相关实体之间的语义相关度、以及根据对应的K个概念确定每个相关实体的第一实体嵌入表示;然后根据第一实体嵌入表示和语义相关度,对实体/关系的嵌入表示进行建模,并结合注意力机制和预设的模型训练方法对模型进行训练,得到实体/关系的嵌入表示。采用本申请实施例,可以捕获实体的背景内容、实现实体的语义扩展,提高嵌入表示模型在实体之间复杂关系下的表示能力、以及知识图谱补全的准确性和全面性。
-
公开(公告)号:CN114265922A
公开(公告)日:2022-04-01
申请号:CN202111395477.0
申请日:2021-11-23
Applicant: 清华大学
IPC: G06F16/332 , G06F16/36 , G06F40/279
Abstract: 本发明提供一种基于跨语言的自动问答、模型训练方法及设备,其中的方法包括:获取问题和文本,文本的语言不同于问题的语言;将问题和文本输入至自动问答模型,得到自动问答模型输出的文本中问题的答案的位置信息;其中,自动问答模型是基于问题样本及包含问题样本的答案的文本样本,对包含知识增强的预训练模型的预设模型进行训练得到的,知识增强的预训练模型是基于利用知识图谱构建的多个多元组,对初始的预训练模型进行预训练得到的,能够学习到跨语言的知识以建立不同语言之间的对应关系,从而使得知识增强的预训练模型的推理能力和对不同语言的理解能力得到了增强,进而实现了自动问答模型对跨语言的问答的性能的提升。
-
公开(公告)号:CN116128038A
公开(公告)日:2023-05-16
申请号:CN202211610968.7
申请日:2022-12-14
Applicant: 清华大学
Abstract: 本发明提供一种基于逻辑激活函数和层级梯度嫁接法的神经网络训练方法,包括:获取待训练的可解释神经网络;将所述待训练的可解释神经网络输入至预先构建的网络训练模型中,以得到训练结果;其中,所述网络训练模型是基于逻辑激活函数和层级梯度嫁接法构建的。本发明基于逻辑激活函数和层级梯度嫁接法构建了网络训练模型,所述逻辑激活函数利用新的方式模拟短路和断路操作,所述层级梯度嫁接法调整了传播方式,实现可扩展性更好、拟合能力更强的可解释神经网络训练。
-
公开(公告)号:CN114298042A
公开(公告)日:2022-04-08
申请号:CN202111444208.9
申请日:2021-11-30
Applicant: 清华大学
IPC: G06F40/295 , G06F40/30 , G06N5/02 , G06N3/08 , G06N3/04
Abstract: 本发明提供一种实体链接方法、实体链接模型训练方法及电子设备,方法通过获取文本中的待链接实体;将待链接实体输入至实体链接模型,获取实体链接模型输出的待链接实体与知识库中各实体的匹配分值;其中,实体链接模型是基于第一预设数量的弱监督数据样本、第二预设数量的真实数据样本和预先确定的实体标签训练后得到的,真实数据样本用于通过元学习规则调整弱监督数据样本的权重为目标训练权重,弱监督数据样本和真实数据样本均包括实体名称样本、实体提及样本和实体提及的上下文样本,第一预设数量大于第二预设数量;将待链接实体链接至知识库中匹配分值最高的实体,通过少量的真实数据样本提高实体链接模型的精确度,更准确的实现了实体链接。
-
公开(公告)号:CN112148883A
公开(公告)日:2020-12-29
申请号:CN201910583845.0
申请日:2019-06-29
IPC: G06F16/36
Abstract: 本申请实施例公开了一种知识图谱的嵌入表示方法及相关设备,所述方法包括:可以从预设的知识库中获取目标知识图谱的M个实体中每个实体的N个相关实体,以及每个相关实体对应的K个概念;接着确定每个实体与该实体的每个相关实体之间的语义相关度、以及根据对应的K个概念确定每个相关实体的第一实体嵌入表示;然后根据第一实体嵌入表示和语义相关度,对实体/关系的嵌入表示进行建模,并结合注意力机制和预设的模型训练方法对模型进行训练,得到实体/关系的嵌入表示。采用本申请实施例,可以捕获实体的背景内容、实现实体的语义扩展,提高嵌入表示模型在实体之间复杂关系下的表示能力、以及知识图谱补全的准确性和全面性。
-
公开(公告)号:CN119293257A
公开(公告)日:2025-01-10
申请号:CN202411189770.5
申请日:2019-06-29
Abstract: 本申请实施例公开了一种知识图谱的嵌入表示方法及相关设备,所述方法包括:可以从预设的知识库中获取目标知识图谱的M个实体中每个实体的N个相关实体,以及每个相关实体对应的K个概念;接着确定每个实体与该实体的每个相关实体之间的语义相关度、以及根据对应的K个概念确定每个相关实体的第一实体嵌入表示;然后根据第一实体嵌入表示和语义相关度,对实体/关系的嵌入表示进行建模,并结合注意力机制和预设的模型训练方法对模型进行训练,得到实体/关系的嵌入表示。采用本申请实施例,可以捕获实体的背景内容、实现实体的语义扩展,提高嵌入表示模型在实体之间复杂关系下的表示能力、以及知识图谱补全的准确性和全面性。
-
公开(公告)号:CN109710656A
公开(公告)日:2019-05-03
申请号:CN201811340599.8
申请日:2018-11-12
Applicant: 清华大学
IPC: G06F16/2458 , G06F16/22
Abstract: 本发明实施例提供的一种近似查询方法及装置,通过获取待查询数据,对所述待查询数据进行划分获得数据序列段;对每个数据序列段进行特征映射,获得各数据序列段对应特征值,根据所述特征值生成特征序列;获取相似度阈值,根据所述特征序列和相似度阈值在预设的B+树索引结构中获得对应的结果特征序列;将对应于所述结果特征序列的结果数据显示,可以更好的支持内存空间进行严格限制及数据频繁更新的情况,并且可以提供高效、稳定的近似查询。
-
-
-
-
-
-
-