基于用户反馈的行业拼写错误检查方法
摘要:
本发明公开了一种基于用户反馈的行业拼写错误检查方法,该方法利用分类设计的用户字典,采用N-gram方法对英文文本进行拼写错误检查,并通过大语料数据库搜索来完成正确单词的推荐,从而实现与用户相关联的拼写错误检查。N-gram作为自然语言处理的基本方法,通过单词或语句特征以及语料库中的统计信息对文本中的错误进行检查;分类设计的用户字典根据当前使用者的历史信息,结合语料库的统计数据选择出与用户输入文本中错误单词最相关的推荐单词;使用维特比算法找出数据库中条件概率乘积最大的单词链,提高大语料库中隐马尔科夫模型的计算效率和数据库中统计信息的使用效率。
公开/授权文献
0/0