一种用于互联网文本数据的实体关系联合抽取方法、装置
摘要:
本发明提供了一种用于互联网文本数据的实体关系联合抽取方法、装置,其可以有效提高从无结构文本中提取实体、关系三元组信息的准确率,包括构建实体关系联合抽取模型,具有数据预处理层、向量表示层、分类器层;将互联网文本数据输入数据预处理层,提取词构成词序列,枚举所有可能的词组合作为候选实体,构成候选实体序列;将词序列和候选实体序列输入向量表示层,得到对应的表示向量;将表示向量输入分类器层的实体分类器,得到实体;将实体组合得到实体对,将词序列和实体对的表示向量输入关系分类器,得到实体间关系;训练实体关系联合抽取模型,将互联网文本数据输入训练好的模型,输出实体和实体间关系,得到三元组 。
0/0