- 专利标题: 基于语音识别的文本处理方法、装置、电子设备及介质
-
申请号: CN202110302727.5申请日: 2021-03-22
-
公开(公告)号: CN113053390B公开(公告)日: 2022-12-02
- 发明人: 王天哲
- 申请人: 深圳如布科技有限公司
- 申请人地址: 广东省深圳市宝安区航城街道三围社区泰华梧桐工业园处暑(9A)栋4层
- 专利权人: 深圳如布科技有限公司
- 当前专利权人: 深圳如布科技有限公司
- 当前专利权人地址: 广东省深圳市宝安区航城街道三围社区泰华梧桐工业园处暑(9A)栋4层
- 代理机构: 北京云知万象专利代理事务所
- 代理商 何辉
- 主分类号: G10L15/26
- IPC分类号: G10L15/26 ; G06F40/117
摘要:
本发明实施例公开了一种基于语音识别的文本处理方法、装置、电子设备及存储介质。所述方法包括:将语音识别获取的初始文本序列切分为至少两个切分对象,并确定至少两个切分对象中相邻两个切分对象之间的静音时长,进而依据各个相邻两个切分对象之间的静音时长,在至少两个切分对象中添加匹配的标点符号,得到带标点符号的目标文本序列。采用本申请技术方案,在对语音进行识别后可利用识别的文本中相邻单词或单字之间的静音时长,通过进行静音长度动态跟踪在各个单词或单字之间添加合适的标点符合,简单地使用语音识别器的静音信息就能实现快速标点符号断句的效果,增加文本识别结果的可读性,解决相关语音识别技术中无法自动添加标点符号,从而降低用户文本可读性的问题。
公开/授权文献
- CN113053390A 基于语音识别的文本处理方法、装置、电子设备及介质 公开/授权日:2021-06-29