- 专利标题: 文本拼音的转换方法及装置、存储介质及电子设备
-
申请号: CN202110857506.4申请日: 2021-07-28
-
公开(公告)号: CN113506561B公开(公告)日: 2023-07-11
- 发明人: 黄智超 , 王强
- 申请人: 北京读我网络技术有限公司
- 申请人地址: 北京市海淀区马甸东路17号22层2615-2
- 专利权人: 北京读我网络技术有限公司
- 当前专利权人: 北京读我网络技术有限公司
- 当前专利权人地址: 北京市海淀区马甸东路17号22层2615-2
- 代理机构: 北京集佳知识产权代理有限公司
- 代理商 李伟
- 主分类号: G10L13/02
- IPC分类号: G10L13/02 ; G10L13/08 ; G10L25/24 ; G10L25/30 ; G06F40/151 ; G06F40/232 ; G06F40/242 ; G06N3/049 ; G06N3/08
摘要:
本发明提供一种文本拼音的转换方法及装置、存储介质及电子设备,该方法包括:当接收到将文本转换为拼音的触发指令时,确定文本对应的音频,并确定音频对应的各个音频特征;将每个音频特征输入预先建立的声学模型,经声学模型处理后,获得每个音频特征对应的概率集合,每个音频特征对应的概率集合中包括该音频特征对应每个音素的概率;依据预设的词典,确定文本对应的各组拼音序列;依据各个音频特征对应的概率集合,确定每组拼音序列对应的概率,将对应概率最大的拼音序列确定为目标拼音序列,并将目标拼音序列确定为该文本对应的文本拼音。应用本发明的方法,结合音频特征确定拼音,可提高文本拼音与音频的匹配准确度,改善合成器的训练效果。
公开/授权文献
- CN113506561A 文本拼音的转换方法及装置、存储介质及电子设备 公开/授权日:2021-10-15