发明公开
- 专利标题: 一种文本数据的信息抽取方法及装置
- 专利标题(英): Information extraction method and device for text data
-
申请号: CN201711458887.9申请日: 2017-12-28
-
公开(公告)号: CN109977391A公开(公告)日: 2019-07-05
- 发明人: 李小文 , 李晟 , 房耘耘 , 杨东 , 王伟 , 邢荣荣
- 申请人: 中国移动通信集团公司 , 中移(苏州)软件技术有限公司
- 申请人地址: 北京市西城区金融大街29号;
- 专利权人: 中国移动通信集团公司,中移(苏州)软件技术有限公司
- 当前专利权人: 中移(成都)信息通信科技有限公司,中移(苏州)软件技术有限公司中国移动通信集团有限公司
- 当前专利权人地址: 北京市西城区金融大街29号;
- 代理机构: 北京派特恩知识产权代理有限公司
- 代理商 王姗姗; 张颖玲
- 主分类号: G06F17/27
- IPC分类号: G06F17/27
摘要:
本发明公开了一种文本数据的信息抽取方法,包括:根据获取的文本数据中字符的上下文字符数据,对文本数据所包含的字符的词性进行标注,确定出包含有字符词性标注的文本数据;抽取所述包含有字符词性标注的文本数据中的关系短语,生成短语种子模板;将所述包含有字符词性标注的文本数据与所述短语种子模板进行匹配,确定出文本数据中与所述短语种子模板匹配的短语,生成包含有所述匹配的短语与所述短语种子模板对应关系的结构数据;计算所述结构数据中短语种子模板的可信度,将可信度大于等于设定可信度阈值的短语种子模板输出。本发明还同时公开了一种文本数据的信息抽取装置及计算机可读存储介质。
公开/授权文献
- CN109977391B 一种文本数据的信息抽取方法及装置 公开/授权日:2020-12-08