实体链接方法、实体链接模型训练方法及电子设备

    公开(公告)号:CN114298042A

    公开(公告)日:2022-04-08

    申请号:CN202111444208.9

    申请日:2021-11-30

    Applicant: 清华大学

    Abstract: 本发明提供一种实体链接方法、实体链接模型训练方法及电子设备,方法通过获取文本中的待链接实体;将待链接实体输入至实体链接模型,获取实体链接模型输出的待链接实体与知识库中各实体的匹配分值;其中,实体链接模型是基于第一预设数量的弱监督数据样本、第二预设数量的真实数据样本和预先确定的实体标签训练后得到的,真实数据样本用于通过元学习规则调整弱监督数据样本的权重为目标训练权重,弱监督数据样本和真实数据样本均包括实体名称样本、实体提及样本和实体提及的上下文样本,第一预设数量大于第二预设数量;将待链接实体链接至知识库中匹配分值最高的实体,通过少量的真实数据样本提高实体链接模型的精确度,更准确的实现了实体链接。

    文本中实体关系处理方法、装置、电子设备及存储介质

    公开(公告)号:CN112528019B

    公开(公告)日:2025-01-10

    申请号:CN202011388845.4

    申请日:2020-12-01

    Abstract: 本发明提供一种文本中实体关系处理方法、装置、电子设备及存储介质,该方法包括:获取目标文本;将目标文本输入到预设的实体关系处理模型中,得到目标文本中实体关系的类别;实体关系处理模型为将训练文本的特征信息和实体关系的类别作为输入,通过机器学习训练得到的,用于确定文本中实体关系的类别的模型;实体关系处理模型包括编码层、参数优化层和分类层,编码层用于根据目标文本确定特征信息,分类层用于根据目标文本的特征信息和分类参数确定目标文本中实体关系的类别,参数优化层用于对分类参数进行优化;分类参数由文本的类别的元信息确定,实现将类别的元信息作为文本的特性信息的判断指引,使文本中实体关系的分类更准确和高效。

    文本中实体关系处理方法、装置、电子设备及存储介质

    公开(公告)号:CN112528019A

    公开(公告)日:2021-03-19

    申请号:CN202011388845.4

    申请日:2020-12-01

    Abstract: 本发明提供一种文本中实体关系处理方法、装置、电子设备及存储介质,该方法包括:获取目标文本;将目标文本输入到预设的实体关系处理模型中,得到目标文本中实体关系的类别;实体关系处理模型为将训练文本的特征信息和实体关系的类别作为输入,通过机器学习训练得到的,用于确定文本中实体关系的类别的模型;实体关系处理模型包括编码层、参数优化层和分类层,编码层用于根据目标文本确定特征信息,分类层用于根据目标文本的特征信息和分类参数确定目标文本中实体关系的类别,参数优化层用于对分类参数进行优化;分类参数由文本的类别的元信息确定,实现将类别的元信息作为文本的特性信息的判断指引,使文本中实体关系的分类更准确和高效。

    实体链接方法、实体链接模型训练方法及电子设备

    公开(公告)号:CN114298042B

    公开(公告)日:2024-10-15

    申请号:CN202111444208.9

    申请日:2021-11-30

    Applicant: 清华大学

    Abstract: 本发明提供一种实体链接方法、实体链接模型训练方法及电子设备,方法通过获取文本中的待链接实体;将待链接实体输入至实体链接模型,获取实体链接模型输出的待链接实体与知识库中各实体的匹配分值;其中,实体链接模型是基于第一预设数量的弱监督数据样本、第二预设数量的真实数据样本和预先确定的实体标签训练后得到的,真实数据样本用于通过元学习规则调整弱监督数据样本的权重为目标训练权重,弱监督数据样本和真实数据样本均包括实体名称样本、实体提及样本和实体提及的上下文样本,第一预设数量大于第二预设数量;将待链接实体链接至知识库中匹配分值最高的实体,通过少量的真实数据样本提高实体链接模型的精确度,更准确的实现了实体链接。

Patent Agency Ranking