语音批数据生成与混淆方法、语音模型训练方法及装置
摘要:
本发明提供一种语音批数据生成与混淆方法、语音模型训练方法及装置,其中语音批数据生成与混淆方法包括:获取各类别语音数据的样本索引序列;对各类别语音数据的样本索引序列进行混淆,并基于预设类别比例,从混淆后各类别样本索引序列中抽取样本索引,生成多个固定比例数据索引块;对多个固定比例数据索引块进行混淆,并基于混淆后固定比例数据索引块,生成索引批数据。本发明提供的方法及装置,可以保证混淆后任意以固定数据索引块大小为粒度的局部范围内批数据的各个类别样本数量比例稳定,从而增强训练模型的稳定性与泛化能力。
0/0