-
公开(公告)号:CN110472243A
公开(公告)日:2019-11-19
申请号:CN201910728950.9
申请日:2019-08-08
Applicant: 河南大学
Abstract: 本发明涉及一种中文拼写检查方法。包括如下步骤:构建分词模型,对待检测文本进行分词,得到分词序列;辨认分词序列中的可疑字,并对可疑字进行标记;建立混淆集;利用混淆集构建图模型框架生成纠正候选;计算得出最优候选结果。本发明构建了优质的混淆字集,对分词系统做进一步改进,提高分词的准确率,进而更准确地查找错误位置和错误字。
-
公开(公告)号:CN110472243B
公开(公告)日:2023-04-07
申请号:CN201910728950.9
申请日:2019-08-08
Applicant: 河南大学
IPC: G06F40/232 , G06N3/0464 , G06N3/0442 , G06N3/08
Abstract: 本发明涉及一种中文拼写检查方法。包括如下步骤:构建分词模型,对待检测文本进行分词,得到分词序列;辨认分词序列中的可疑字,并对可疑字进行标记;建立混淆集;利用混淆集构建图模型框架生成纠正候选;计算得出最优候选结果。本发明构建了优质的混淆字集,对分词系统做进一步改进,提高分词的准确率,进而更准确地查找错误位置和错误字。
-