一种提高知识库问答准确度的方法及系统

    公开(公告)号:CN110232113A

    公开(公告)日:2019-09-13

    申请号:CN201910292426.1

    申请日:2019-04-12

    Abstract: 本发明提出一种提高知识库问答准确度的方法及系统,包括:获取待回答的用户问句,提取该用户问句中的主题实体,以该主题实体检索知识库,将得到的每一个候选答案的路径信息作为候选路径,并预处理该用户问句,得到该用户问句的向量表示;利用该向量表示对该候选路径上的每一步关系利用注意力机制进行打分,得到该候选路径上的每一步关系的关系置信度,并将该候选路径上所有的关系置信度求和,得到关系路径的路径置信度;将所有候选路径根据其置路径置信度进行排序,输出路径置信度最高的候选路径作为该用户问句的回答结果。本发明增强了中间结点在整个关系推断中的作用,提高了关系推断的准确率。

    知识库问答系统中的实体链接方法

    公开(公告)号:CN109271524A

    公开(公告)日:2019-01-25

    申请号:CN201810870053.7

    申请日:2018-08-02

    Abstract: 本发明提供一种知识库问答系统中的实体链接方法,包括:从问句中获取主题词集合;根据获取的主题词集合在知识库中进行搜索,得到初步候选实体集合;对于所述初步候选实体集合中的每个实体,从该实体、所述问句以及所述知识库提取相应的特征;以及,根据提取到的所述初步候选实体集合中的每个实体的特征,得到该实体的评分,并且根据评分得到候选实体集合;本发明提高了实体链接的准确性和效率。

    一种面向知识获取的主动学习方法

    公开(公告)号:CN119294469A

    公开(公告)日:2025-01-10

    申请号:CN202411219818.2

    申请日:2024-09-02

    Abstract: 本发明提供一种面向知识获取的主动学习方法,用于对知识获取模型进行多次迭代训练,每次迭代包括:获取有多个有标签的样本的第一训练集和有多个未标注标签的样本的候选数据集,每个样本为一段文本数据,标签为在知识获取任务中为样本设置的知识类别标签;获取预设的查询函数,该函数用于计算样本对训练模型的价值量化值,样本的价值量化值是预设的不确定性指标和多个预设指标的加权和,多个预设指标包括动量指标、方差指标和损失值指标中任意两个或三个;根据利用查询函数计算的多个未标注标签的样本各自的价值量化值,选择有价值的样本,对其标注标签后添加到第一训练集,得到第二训练集;利用第二训练集训练模型根据文本数据进行知识类别预测。

    一种复杂实体抽取方法、装置、介质及系统

    公开(公告)号:CN110502742B

    公开(公告)日:2021-11-05

    申请号:CN201910625736.0

    申请日:2019-07-11

    Abstract: 本发明涉及一种复杂实体抽取方法,用于迭层膨胀卷积神经网络,该神经网络包括字级别迭层膨胀卷积神经网络层和词级别迭层膨胀卷积神经网络层,该方法包括:语料生成步骤,用于构建实体语料集,以采集语料,并对该语料进行自定义格式标注,形成训练集、测试集和/或验证集;字级别向量生成步骤,用于对该语料进行预训练,生成字向量,并将该字向量输入该字级别迭层膨胀卷积神经网络层,得到字级别向量;自定义特征提取步骤,用于从自由文本中提取所述自定义格式标注的特征;实体抽取步骤,将所述字级别向量进行拼接后,与所述词级别特征输入该词级别迭层膨胀卷积神经网络层,对所述自由文本进行复杂实体的抽取。该方法提高了实体抽取的精度和效率。

Patent Agency Ranking