-
公开(公告)号:CN101576872B
公开(公告)日:2014-05-28
申请号:CN200910086633.8
申请日:2009-06-16
Applicant: 北京系统工程研究所
Abstract: 本发明公开了一种中文文本处理方法及装置,该方法包括:获取待分割中文文本,使用中文分词方法对待分割中文文本进行分割,得到N0个初始文本片段;对所述N0个初始文本片段进行M级聚合处理,得到NM个第M级文本片段;其中,N0、NM、M分别为不小于1的整数。该方法及装置能够降低检索结果的误报概率。
-
公开(公告)号:CN101576872A
公开(公告)日:2009-11-11
申请号:CN200910086633.8
申请日:2009-06-16
Applicant: 北京系统工程研究所
Abstract: 本发明公开了一种中文文本处理方法及装置,该方法包括:获取待分割中文文本,使用中文分词方法对待分割中文文本进行分割,得到N0个初始文本片段;对所述N0个初始文本片段进行M级聚合处理,得到NM个第M级文本片段;其中,N0、NM、M分别为不小于1的整数。该方法及装置能够降低检索结果的误报概率。
-