发明授权
CN103885938B 基于用户反馈的行业拼写错误检查方法
失效 - 权利终止
- 专利标题: 基于用户反馈的行业拼写错误检查方法
- 专利标题(英): Industry spelling mistake checking method based on user feedback
-
申请号: CN201410149427.8申请日: 2014-04-14
-
公开(公告)号: CN103885938B公开(公告)日: 2015-04-22
- 发明人: 杨明 , 罗军舟 , 倪俊辉 , 马成平 , 任新才
- 申请人: 东南大学 , 焦点科技股份有限公司
- 申请人地址: 江苏省南京市四牌楼2号东南大学四牌楼校区
- 专利权人: 东南大学,焦点科技股份有限公司
- 当前专利权人: 东南大学,焦点科技股份有限公司
- 当前专利权人地址: 江苏省南京市四牌楼2号东南大学四牌楼校区
- 代理机构: 南京知识律师事务所
- 代理商 张苏沛
- 主分类号: G06F17/27
- IPC分类号: G06F17/27 ; G06F17/30
摘要:
本发明公开了一种基于用户反馈的行业拼写错误检查方法,该方法利用分类设计的用户字典,采用N-gram方法对英文文本进行拼写错误检查,并通过大语料数据库搜索来完成正确单词的推荐,从而实现与用户相关联的拼写错误检查。N-gram作为自然语言处理的基本方法,通过单词或语句特征以及语料库中的统计信息对文本中的错误进行检查;分类设计的用户字典根据当前使用者的历史信息,结合语料库的统计数据选择出与用户输入文本中错误单词最相关的推荐单词;使用维特比算法找出数据库中条件概率乘积最大的单词链,提高大语料库中隐马尔科夫模型的计算效率和数据库中统计信息的使用效率。
公开/授权文献
- CN103885938A 基于用户反馈的行业拼写错误检查方法 公开/授权日:2014-06-25