- 专利标题: 文本纠错方法、装置、电子设备及计算机可读存储介质
-
申请号: CN202011435068.4申请日: 2020-12-10
-
公开(公告)号: CN112528633B公开(公告)日: 2024-10-29
- 发明人: 洪振厚 , 王健宗 , 瞿晓阳
- 申请人: 平安科技(深圳)有限公司
- 申请人地址: 广东省深圳市福田区福田街道福安社区益田路5033号平安金融中心23楼
- 专利权人: 平安科技(深圳)有限公司
- 当前专利权人: 平安科技(深圳)有限公司
- 当前专利权人地址: 广东省深圳市福田区福田街道福安社区益田路5033号平安金融中心23楼
- 代理机构: 深圳市沃德知识产权代理事务所
- 代理商 高杰; 于志光
- 主分类号: G06F40/232
- IPC分类号: G06F40/232 ; G06F40/205 ; G06F40/166 ; G06F40/126
摘要:
本发明涉及语音语义技术,揭露了一种文本纠错方法,包括:对获取的原始文本进行字符拆分,得到字符集;利用表征算法计算字符集中每个字符的字符表征;根据字符集与字符表征构建字符集中每个字符的字符向量;获取标准字符向量集,分别计算字符集中每个字符的字符向量与标准字符向量集中各标准字符向量的相似度;根据相似度从标准字符向量集中筛选出;计算相似向量的先验依赖性概率,根据先验依赖性概率选择相似向量对原始文本进行文本纠错,得到纠错文本。此外,本发明还涉及区块链技术,所述标准字符向量集可存储于区块链的节点。本发明还提出一种文本纠错装置、设备以及介质。本发明可以解决文本纠错的精确度不高的问题。
公开/授权文献
- CN112528633A 文本纠错方法、装置、电子设备及计算机可读存储介质 公开/授权日:2021-03-19