- 专利标题: 一种用于互联网文本数据的实体关系联合抽取方法、装置
-
申请号: CN202111177032.5申请日: 2021-10-09
-
公开(公告)号: CN113806493B公开(公告)日: 2023-08-29
- 发明人: 宋怡晨 , 李爱平 , 贾焰 , 周斌 , 涂宏魁 , 王晔 , 江荣 , 徐锡山 , 喻承
- 申请人: 中国人民解放军国防科技大学
- 申请人地址: 湖南省长沙市开福区德雅路109号
- 专利权人: 中国人民解放军国防科技大学
- 当前专利权人: 中国人民解放军国防科技大学
- 当前专利权人地址: 湖南省长沙市开福区德雅路109号
- 代理机构: 苏州国诚专利代理有限公司
- 代理商 陈松
- 主分类号: G06F16/33
- IPC分类号: G06F16/33 ; G06F16/35 ; G06F16/953 ; G06F40/295 ; G06F40/30
摘要:
本发明提供了一种用于互联网文本数据的实体关系联合抽取方法、装置,其可以有效提高从无结构文本中提取实体、关系三元组信息的准确率,包括构建实体关系联合抽取模型,具有数据预处理层、向量表示层、分类器层;将互联网文本数据输入数据预处理层,提取词构成词序列,枚举所有可能的词组合作为候选实体,构成候选实体序列;将词序列和候选实体序列输入向量表示层,得到对应的表示向量;将表示向量输入分类器层的实体分类器,得到实体;将实体组合得到实体对,将词序列和实体对的表示向量输入关系分类器,得到实体间关系;训练实体关系联合抽取模型,将互联网文本数据输入训练好的模型,输出实体和实体间关系,得到三元组 。
公开/授权文献
- CN113806493A 一种用于互联网文本数据的实体关系联合抽取方法、装置 公开/授权日:2021-12-17