一种配网实体相关的语义搜索方法
摘要:
本发明为一种配网实体相关的语义搜索方法,其特征在于包括:对配网实体中的文本进行基于词频统计的分词方法进行分词,得到词库;对配网实体中的文本进行模型分词,得到词库;合并基于词频的词库和基于模型的词库;对词库中分词错误的专有名词进行标注;用标注的词语对配网实体中的文本进行大量的训练,得到词库;合并上述的三个词库,是基于Jieba分词包;所述Jieba分词包可以添加自己标注的专业词语;对词库进行大量的训练之前先将换行符、句号、逗号等分隔符将全文分成短句;基于词频统计分词是统计任意两个字同时出现的频率。
0/0