发明公开
- 专利标题: 文本纠错方法、装置、相关设备及计算机程序产品
-
申请号: CN202410153454.6申请日: 2024-02-02
-
公开(公告)号: CN117973369A公开(公告)日: 2024-05-03
- 发明人: 张轶鑫 , 王宝鑫 , 伍大勇 , 王士进
- 申请人: 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司 , 科大讯飞(北京)有限公司
- 申请人地址: 河北省廊坊市经济技术开发区1号路106号新亚研发大厦608-609; ;
- 专利权人: 河北省讯飞人工智能研究院,科大讯飞股份有限公司,科大讯飞(北京)有限公司
- 当前专利权人: 河北省讯飞人工智能研究院,科大讯飞股份有限公司,科大讯飞(北京)有限公司
- 当前专利权人地址: 河北省廊坊市经济技术开发区1号路106号新亚研发大厦608-609; ;
- 代理机构: 北京集佳知识产权代理有限公司
- 代理商 王雨
- 主分类号: G06F40/232
- IPC分类号: G06F40/232 ; G06F40/284 ; G06F40/242 ; G06F18/214 ; G06F18/213 ; G06F18/2411 ; G06F18/25
摘要:
本申请公开了一种文本纠错方法、装置、相关设备及计算机程序产品,本申请分别采用通用词典和目标领域的专业词典对待纠错文本进行分词,得到第一分词结果和第二分词结果,由第一分词结果确定通用词典向量,由第二分词结果确定专业词典向量,对两种词典向量进行融合,基于融合向量确定待纠错文本对应的纠错后文本。通用词典向量涵盖了待纠错文本中可能存在的一般性错误信息,专业词典向量涵盖了待纠错文本中可能存在的目标领域下专业词汇的拼写错误信息,基于融合向量确定待纠错文本的纠错后文本,保证了本申请方案对常见的一般性错误的纠错能力,以及对特定垂类领域的专业词汇的拼写错误的纠错能力,大大提升了文本纠错效果。