基于语音识别的文本处理方法、装置、电子设备及介质

发明授权

CN113053390B 基于语音识别的文本处理方法、装置、电子设备及介质有权转让

请登陆查看更多内容

专利标题： 基于语音识别的文本处理方法、装置、电子设备及介质
申请号： CN202110302727.5

申请日： 2021-03-22
公开(公告)号： CN113053390B

公开(公告)日： 2022-12-02
发明人: 王天哲
申请人： 深圳如布科技有限公司
申请人地址： 广东省深圳市宝安区航城街道三围社区泰华梧桐工业园处暑(9A)栋4层
专利权人： 深圳如布科技有限公司
当前专利权人： 深圳如布科技有限公司
当前专利权人地址： 广东省深圳市宝安区航城街道三围社区泰华梧桐工业园处暑(9A)栋4层
代理机构： 北京云知万象专利代理事务所
代理商 何辉
主分类号： G10L15/26
IPC分类号： G10L15/26 ; G06F40/117

摘要：

本发明实施例公开了一种基于语音识别的文本处理方法、装置、电子设备及存储介质。所述方法包括：将语音识别获取的初始文本序列切分为至少两个切分对象，并确定至少两个切分对象中相邻两个切分对象之间的静音时长，进而依据各个相邻两个切分对象之间的静音时长，在至少两个切分对象中添加匹配的标点符号，得到带标点符号的目标文本序列。采用本申请技术方案，在对语音进行识别后可利用识别的文本中相邻单词或单字之间的静音时长，通过进行静音长度动态跟踪在各个单词或单字之间添加合适的标点符合，简单地使用语音识别器的静音信息就能实现快速标点符号断句的效果，增加文本识别结果的可读性，解决相关语音识别技术中无法自动添加标点符号，从而降低用户文本可读性的问题。

公开/授权文献

CN113053390A 基于语音识别的文本处理方法、装置、电子设备及介质公开/授权日：2021-06-29

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G10	乐器；声学
G10L	语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码
G10L15/00	语音识别（G10L17/00优先）
G10L15/26	.语音—正文识别系统（G10L15/08优先）