-
公开(公告)号:CN117672175A
公开(公告)日:2024-03-08
申请号:CN202211021906.2
申请日:2022-08-24
Applicant: 北京小米移动软件有限公司
IPC: G10L13/02 , G10L13/033 , G10L13/08 , G10L13/10
Abstract: 本公开是关于一种语音合成方法及装置、电子设备、存储介质。其中,该方法,包括:获取第一对象的第一语音和第二对象的第二语音;从所述第一语音中提取所述第一对象的第一音色特征、从所述第二语音中提取内容信息,所述内容信息中包含所述第二对象的第二音色特征的一部分和所述第二语音的语义信息;对所述第一音色特征和所述内容信息进行语音合成,得到目标语音。
-
公开(公告)号:CN115273872A
公开(公告)日:2022-11-01
申请号:CN202210855246.1
申请日:2022-07-19
Applicant: 北京小米移动软件有限公司
IPC: G10L21/003 , G10L15/18 , G10L15/06
Abstract: 本公开关于一种语音转换方法、装置、电子设备及存储介质。其中,所述语音转换方法,包括:通过获取待转换语音数据,以及目标数据,然后将待转换语音数据和目标数据输入至语音转换模型,其中,语音转换模型基于非平行语音数据和平行语音数据分阶段训练得到,最后通过语音转换模型对待转换语音数据和目标数据进行语音转换处理,得到目标语音数据。采用本公开实施例提供的语音转换方法,能够提高语音转换效果。
-
公开(公告)号:CN117672240A
公开(公告)日:2024-03-08
申请号:CN202211020826.5
申请日:2022-08-24
Applicant: 北京小米移动软件有限公司
Abstract: 本公开是关于一种语音转换方法及装置、电子设备、存储介质。其中,该方法,包括:在声纹隐藏功能启动的情况下,获取用户的待转换语音,并提取所述待转换语音的语义信息;获取目标音色特征,所述目标音色特征为区别于所述用户的原始音色特征的其他音色特征;对所述语义信息和所述目标音色特征进行语音合成,得到转换后语音。
-
公开(公告)号:CN119170037A
公开(公告)日:2024-12-20
申请号:CN202310739113.2
申请日:2023-06-20
Applicant: 北京小米移动软件有限公司
IPC: G10L21/0308 , G10L25/30
Abstract: 本公开是关于一种音源分离方法、装置及存储介质。其中,音源分离方法包括:获取混合音频的频域特征;将频域特征按照不同频带依次划分为多个子带频域特征;将多个子带频域特征中每一子带频域特征按照划分顺序与对应的全局子带频域特征融合,对融合有子带频域特征的全局子带频域特征进行全局子带频域特征识别,并将识别的结果作为与下一个子带频域特征融合的全局子带频域特征,重复执行上述融合以及全局子带频域特征识别的过程,直至完成识别次数的全局子带频域特征识别,得到混合音频的子带频域特征识别结果;基于混合音频的子带频域特征识别结果,对混合音频中包括的不同频带音源进行音源分离。通过本公开,能够实现多频带音源的分离。
-
-
-