一种中文文本自动校正方法

    公开(公告)号:CN105279149A

    公开(公告)日:2016-01-27

    申请号:CN201510688403.4

    申请日:2015-10-21

    Abstract: 本发明公开了一种中文文本自动校正方法,包括如下步骤:a)输入待校对中文文本,按单句对中文文本进行分词预处理;b)按单句查找分词文本中出现的单字、双字或三字及其以上散串;c)采用N-gram模型对分词文本中出现的散串进行连续判断,并结合单字成词概率对每个单句检查文本词级的错误;d)构造纠错知识库生成纠错候选文本。本发明提供的中文文本自动校正方法,按单句查找分词文本中出现的单字、双字或三字及其以上散串,采用N-gram模型对分词文本中出现的散串进行连续判断确定标识错误,并构造纠错知识库生成纠错候选文本,从而将查错和纠错过程很好地结合起来,具有查错速度快,纠错效率高的特点。

Patent Agency Ranking