一种文本数据的信息抽取方法及装置
摘要:
本发明公开了一种文本数据的信息抽取方法,包括:根据获取的文本数据中字符的上下文字符数据,对文本数据所包含的字符的词性进行标注,确定出包含有字符词性标注的文本数据;抽取所述包含有字符词性标注的文本数据中的关系短语,生成短语种子模板;将所述包含有字符词性标注的文本数据与所述短语种子模板进行匹配,确定出文本数据中与所述短语种子模板匹配的短语,生成包含有所述匹配的短语与所述短语种子模板对应关系的结构数据;计算所述结构数据中短语种子模板的可信度,将可信度大于等于设定可信度阈值的短语种子模板输出。本发明还同时公开了一种文本数据的信息抽取装置及计算机可读存储介质。
公开/授权文献
0/0