-
公开(公告)号:CN118398000A
公开(公告)日:2024-07-26
申请号:CN202410352725.0
申请日:2024-03-26
Applicant: 科大讯飞股份有限公司
IPC: G10L13/027 , G10L13/08 , G06N3/0455 , G06N3/0442 , G06N3/0464 , G06N3/094
Abstract: 本申请公开了一种音频合成方法及相关方法、装置、设备和存储介质,其中,音频合成方法包括:基于素材音频进行编码,得到第一特征集合;基于第一特征集合中包含末位音频特征的至少部分音频特征进行自回归,得到对目标帧预测的音频特征,以更新第一特征集合;其中,目标帧的音频特征接续于第一特征集合中末位,且在首轮自回归之后执行自回归时参考首轮自回归;基于最新第一特征集合进行解码,得到合成音频。上述方案,能够在尽可能地合成长时音频的前提下,提升合成稳定性。