语音生成方法、设备、介质和计算机程序产品
摘要:
本公开涉及通信技术领域,尤其是提供一种语音生成方法、设备、介质和计算机程序产品。上述语音生成方法包括:在被叫用户激活智能回复功能的情况下,获取主叫用户的音频数据和被叫用户的声纹特征;对音频数据进行语义识别处理,获得主叫用户的情绪信息和意图信息,并基于情绪信息和意图信息生成回复文本;基于声纹特征将回复文本转换为初始语音回复;对初始语音回复进行降噪处理,获得目标语音回复,并向主叫用户发送目标语音回复。本公开通过综合使用语义识别技术、个性化的声纹特征和降噪处理,使得生成的语音回复能真实还原自然人在类似情况下的自然反应,使得智能语音回复更加真实,提高了用户的通话体验。
0/0