基于人工智能的语音数据处理方法、系统、设备及介质
摘要:
本发明公开了一种基于人工智能的语音数据处理方法、系统、设备及介质,包括接收用户发送的有声读物阅读的语音请求指令,提取用户语音的情感特征和音色特征,匹配有声读物的阅读风格;根据阅读风格确定朗读者标签和目标音色特征,将阅读文本的音素和朗读者标签输入至情感预测器,得到符合阅读风格的目标情感特征;利用阅读文本的音素和目标音色特征生成发音表征,将其和目标情感特征进行特征融合,生成目标语音特征;将目标语音特征和朗读者标签输入至语音合成模型,生成目标阅读语音并推送至用户。本发明能够识别用户的情感状态和音色状态,以匹配对应的阅读风格,定制化地生成适配于用户的播放语音,增强了用户体验。
0/0