文本纠错方法、装置、相关设备及计算机程序产品
摘要:
本申请公开了一种文本纠错方法、装置、相关设备及计算机程序产品,本申请分别采用通用词典和目标领域的专业词典对待纠错文本进行分词,得到第一分词结果和第二分词结果,由第一分词结果确定通用词典向量,由第二分词结果确定专业词典向量,对两种词典向量进行融合,基于融合向量确定待纠错文本对应的纠错后文本。通用词典向量涵盖了待纠错文本中可能存在的一般性错误信息,专业词典向量涵盖了待纠错文本中可能存在的目标领域下专业词汇的拼写错误信息,基于融合向量确定待纠错文本的纠错后文本,保证了本申请方案对常见的一般性错误的纠错能力,以及对特定垂类领域的专业词汇的拼写错误的纠错能力,大大提升了文本纠错效果。
0/0