文本纠错方法、装置、电子设备及计算机可读存储介质
摘要:
本发明涉及语音语义技术,揭露了一种文本纠错方法,包括:对获取的原始文本进行字符拆分,得到字符集;利用表征算法计算字符集中每个字符的字符表征;根据字符集与字符表征构建字符集中每个字符的字符向量;获取标准字符向量集,分别计算字符集中每个字符的字符向量与标准字符向量集中各标准字符向量的相似度;根据相似度从标准字符向量集中筛选出;计算相似向量的先验依赖性概率,根据先验依赖性概率选择相似向量对原始文本进行文本纠错,得到纠错文本。此外,本发明还涉及区块链技术,所述标准字符向量集可存储于区块链的节点。本发明还提出一种文本纠错装置、设备以及介质。本发明可以解决文本纠错的精确度不高的问题。
0/0