-
公开(公告)号:CN109977391B
公开(公告)日:2020-12-08
申请号:CN201711458887.9
申请日:2017-12-28
申请人: 中国移动通信集团公司 , 中移(苏州)软件技术有限公司
IPC分类号: G06F40/216 , G06F40/30 , G06F40/253 , G06F16/36
摘要: 本发明公开了一种文本数据的信息抽取方法,包括:根据获取的文本数据中字符的上下文字符数据,对文本数据所包含的字符的词性进行标注,确定出包含有字符词性标注的文本数据;抽取所述包含有字符词性标注的文本数据中的关系短语,生成短语种子模板;将所述包含有字符词性标注的文本数据与所述短语种子模板进行匹配,确定出文本数据中与所述短语种子模板匹配的短语,生成包含有所述匹配的短语与所述短语种子模板对应关系的结构数据;计算所述结构数据中短语种子模板的可信度,将可信度大于等于设定可信度阈值的短语种子模板输出。本发明还同时公开了一种文本数据的信息抽取装置及计算机可读存储介质。
-
公开(公告)号:CN110309258A
公开(公告)日:2019-10-08
申请号:CN201810214555.4
申请日:2018-03-15
申请人: 中国移动通信集团有限公司 , 中移(苏州)软件技术有限公司
摘要: 本发明实施例公开了一种输入检查方法、服务器和计算机可读存储介质,当待检查关键词为至少两个待检查关键词时,从预设标准语料库中获取至少两个待检查关键词对应的至少两个属性,待检查关键词为对待搜索语句进行搜索时对应的关键词;当至少两个属性中第一待检查关键词的属性属于预设检查属性时,根据第一待检查关键词的属性,确定第一待检查关键词对应的第一实体;从预设实体关系库中,查找与第一实体相关的至少一个实体;基于预设相关度计算方法,从至少一个实体中确定出与第二待检查关键词相关度最高的待查询实体,以利用第一实体和待查询实体进行搜索的过程,第二待检查关键词为至少两个待检查关键词中除第一待检查关键词外的待检查关键词。
-
公开(公告)号:CN109977391A
公开(公告)日:2019-07-05
申请号:CN201711458887.9
申请日:2017-12-28
申请人: 中国移动通信集团公司 , 中移(苏州)软件技术有限公司
IPC分类号: G06F17/27
摘要: 本发明公开了一种文本数据的信息抽取方法,包括:根据获取的文本数据中字符的上下文字符数据,对文本数据所包含的字符的词性进行标注,确定出包含有字符词性标注的文本数据;抽取所述包含有字符词性标注的文本数据中的关系短语,生成短语种子模板;将所述包含有字符词性标注的文本数据与所述短语种子模板进行匹配,确定出文本数据中与所述短语种子模板匹配的短语,生成包含有所述匹配的短语与所述短语种子模板对应关系的结构数据;计算所述结构数据中短语种子模板的可信度,将可信度大于等于设定可信度阈值的短语种子模板输出。本发明还同时公开了一种文本数据的信息抽取装置及计算机可读存储介质。
-
公开(公告)号:CN110309258B
公开(公告)日:2022-03-29
申请号:CN201810214555.4
申请日:2018-03-15
申请人: 中国移动通信集团有限公司 , 中移(苏州)软件技术有限公司
IPC分类号: G06F16/33 , G06F40/30 , G06F40/289
摘要: 本发明实施例公开了一种输入检查方法、服务器和计算机可读存储介质,当待检查关键词为至少两个待检查关键词时,从预设标准语料库中获取至少两个待检查关键词对应的至少两个属性,待检查关键词为对待搜索语句进行搜索时对应的关键词;当至少两个属性中第一待检查关键词的属性属于预设检查属性时,根据第一待检查关键词的属性,确定第一待检查关键词对应的第一实体;从预设实体关系库中,查找与第一实体相关的至少一个实体;基于预设相关度计算方法,从至少一个实体中确定出与第二待检查关键词相关度最高的待查询实体,以利用第一实体和待查询实体进行搜索的过程,第二待检查关键词为至少两个待检查关键词中除第一待检查关键词外的待检查关键词。
-
-
-