- 专利标题: 基于人工智能的语音数据处理方法、系统、设备及介质
-
申请号: CN202410482688.5申请日: 2024-04-22
-
公开(公告)号: CN118072712B公开(公告)日: 2024-06-25
- 发明人: 蓝剑 , 张云仲 , 童文 , 邱雪峰
- 申请人: 深圳市海域达赫科技有限公司 , 深圳市蔚沃科技有限公司
- 申请人地址: 广东省深圳市盐田区海山街道鹏湾社区深盐路2001号合景同创广场1栋一单元1-1803;
- 专利权人: 深圳市海域达赫科技有限公司,深圳市蔚沃科技有限公司
- 当前专利权人: 深圳市海域达赫科技有限公司,深圳市蔚沃科技有限公司
- 当前专利权人地址: 广东省深圳市盐田区海山街道鹏湾社区深盐路2001号合景同创广场1栋一单元1-1803;
- 代理机构: 北京易捷胜知识产权代理有限公司
- 代理商 李会娟
- 主分类号: G10L13/02
- IPC分类号: G10L13/02 ; G10L13/08 ; G10L25/75
摘要:
本发明公开了一种基于人工智能的语音数据处理方法、系统、设备及介质,包括接收用户发送的有声读物阅读的语音请求指令,提取用户语音的情感特征和音色特征,匹配有声读物的阅读风格;根据阅读风格确定朗读者标签和目标音色特征,将阅读文本的音素和朗读者标签输入至情感预测器,得到符合阅读风格的目标情感特征;利用阅读文本的音素和目标音色特征生成发音表征,将其和目标情感特征进行特征融合,生成目标语音特征;将目标语音特征和朗读者标签输入至语音合成模型,生成目标阅读语音并推送至用户。本发明能够识别用户的情感状态和音色状态,以匹配对应的阅读风格,定制化地生成适配于用户的播放语音,增强了用户体验。
公开/授权文献
- CN118072712A 基于人工智能的语音数据处理方法、系统、设备及介质 公开/授权日:2024-05-24