发明公开
- 专利标题: 文本规整方法、装置、电子设备和存储介质
-
申请号: CN202311436138.1申请日: 2023-10-31
-
公开(公告)号: CN117252152A公开(公告)日: 2023-12-19
- 发明人: 胡今朝 , 刘聪 , 马志强 , 李永超 , 吴重亮
- 申请人: 科大讯飞股份有限公司
- 申请人地址: 安徽省合肥市高新开发区望江西路666号
- 专利权人: 科大讯飞股份有限公司
- 当前专利权人: 科大讯飞股份有限公司
- 当前专利权人地址: 安徽省合肥市高新开发区望江西路666号
- 代理机构: 北京路浩知识产权代理有限公司
- 代理商 刘余婷
- 主分类号: G06F40/103
- IPC分类号: G06F40/103 ; G06F40/289 ; G06F40/30
摘要:
本发明提供一种文本规整方法、装置、电子设备和存储介质,其中方法包括:获取待规整的原始文本;提取所述原始文本的文本表示,基于所述文本表示对所述原始文本进行数字规整和标点预测,得到所述原始文本中各文本单元的数字规整表示和标点预测表示,所述文本表示、数字规整表示和标点预测表示在同一建模空间内;基于所述各文本单元的数字规整表示和标点预测表示,确定所述原始文本的规整文本。本发明提供的文本规整方法、装置、电子设备和存储介质,采用并行逻辑同时对原始文本分别进行数字规整和标点预测,由此避免了串行逻辑带来的错误累计,提升了文本规整的准确性。