基于音频驱动角色口型的方法及系统
摘要:
本申请公开了一种基于音频驱动角色口型的方法及系统。其首先获取数字人驱动音频,接着,对所述数字人驱动音频进行语音波形特征提取以得到驱动音频波形语义全局特征向量,然后,基于所述驱动音频波形语义全局特征向量,生成数字人口型驱动控制指令。其中,对所述数字人驱动音频进行语音波形特征提取以得到驱动音频波形语义全局特征向量,包括:对所述数字人驱动音频进行数据预处理以得到驱动音频片段的序列;以及,从所述驱动音频片段的序列中提取音频语义特征以得到所述驱动音频波形语义全局特征向量。这样,可以利用深度神经网络从音频信号中提取出语音特征,并将这些特征自动化地映射到角色的口型参数上,从而实现音
公开/授权文献
0/0