-
公开(公告)号:CN103942190B
公开(公告)日:2017-08-25
申请号:CN201410153908.6
申请日:2014-04-16
Applicant: 科大讯飞股份有限公司
IPC: G06F17/27
Abstract: 本发明公开了一种文本分词方法及系统,所述方法包括:预先建立与待处理文本相对应的绑定词典,并绑定所述文本和所述绑定词典,所述绑定词典中的词包括所述文本中未收录在通用词典中的未登录词;将所述文本与所述通用词典中的词进行匹配,得到准分词结果;根据所述绑定词典中的词对所述准分词结果进行修正。采用本发明所述的文本分词方法及系统,通过增加绑定词典,为实现给不同的文本定制相应的词典资源提供了很大的自由度,在不需要修改通用词典情况下,实现文本分析结果的优化。