基于人工智能的语音数据处理方法、系统、设备及介质

发明授权

CN118072712B 基于人工智能的语音数据处理方法、系统、设备及介质有权

请登陆查看更多内容

专利标题： 基于人工智能的语音数据处理方法、系统、设备及介质
申请号： CN202410482688.5

申请日： 2024-04-22
公开(公告)号： CN118072712B

公开(公告)日： 2024-06-25
发明人: 蓝剑 , 张云仲 , 童文 , 邱雪峰
申请人： 深圳市海域达赫科技有限公司 , 深圳市蔚沃科技有限公司
申请人地址： 广东省深圳市盐田区海山街道鹏湾社区深盐路2001号合景同创广场1栋一单元1-1803;
专利权人： 深圳市海域达赫科技有限公司,深圳市蔚沃科技有限公司
当前专利权人： 深圳市海域达赫科技有限公司,深圳市蔚沃科技有限公司
当前专利权人地址： 广东省深圳市盐田区海山街道鹏湾社区深盐路2001号合景同创广场1栋一单元1-1803;
代理机构： 北京易捷胜知识产权代理有限公司
代理商 李会娟
主分类号： G10L13/02
IPC分类号： G10L13/02 ; G10L13/08 ; G10L25/75

摘要：

本发明公开了一种基于人工智能的语音数据处理方法、系统、设备及介质，包括接收用户发送的有声读物阅读的语音请求指令，提取用户语音的情感特征和音色特征，匹配有声读物的阅读风格；根据阅读风格确定朗读者标签和目标音色特征，将阅读文本的音素和朗读者标签输入至情感预测器，得到符合阅读风格的目标情感特征；利用阅读文本的音素和目标音色特征生成发音表征，将其和目标情感特征进行特征融合，生成目标语音特征；将目标语音特征和朗读者标签输入至语音合成模型，生成目标阅读语音并推送至用户。本发明能够识别用户的情感状态和音色状态，以匹配对应的阅读风格，定制化地生成适配于用户的播放语音，增强了用户体验。

公开/授权文献

CN118072712A 基于人工智能的语音数据处理方法、系统、设备及介质公开/授权日：2024-05-24

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G10	乐器；声学
G10L	语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码
G10L13/00	语音合成；文本-语音合成系统
G10L13/02	.产生合成语音的方法；语音合成设备