-
公开(公告)号:CN119360824A
公开(公告)日:2025-01-24
申请号:CN202411272598.X
申请日:2024-09-11
Applicant: 科大讯飞股份有限公司
IPC: G10L13/08 , G10L13/033 , G10L17/02
Abstract: 本申请公开了一种语音增广方法及相关方法、装置、设备和存储介质,其中,语音增广方法包括:获取待增广语音,并获取待合成文本;基于待增广语音进行特征提取,得到待增广语音所属说话人的声纹特征和待增广语音所属场景的环境噪声特征;基于各个待增广语音分别所属说话人的第一分布,选择至少一个说话人的声纹特征,作为目标声纹特征,并基于各个待增广语音分别所属场景的第二分布,选择至少一种场景的环境噪声特征,作为目标环境噪声特征;获取由任一目标声纹特征、任一目标环境噪声特征和待合成文本所合成语音,作为增广语音。上述方案,能够实现语音增广以提升语音数据多样性。