生成心理声学模型的方法及装置

    公开(公告)号:CN102169694A

    公开(公告)日:2011-08-31

    申请号:CN201010123999.0

    申请日:2010-02-26

    IPC分类号: G10L19/02 G10L19/00

    摘要: 本发明公开了一种生成心理声学模型的方法及装置,属于音频处理技术领域。该方法包括:以修正离散余弦变换MDCT对输入的时域音频信号帧进行时频分析,得到MDCT频域参数;根据MDCT频域参数计算谱平坦测度函数、频谱局部最大主导分量扩展包络和频谱局部最小主导分量平均包络,并根据所述谱平坦测度函数、频谱局部最大主导分量扩展包络和频谱局部最小主导分量平均包络计算局部掩蔽门限;根据局部掩蔽门限,生成并输出全局掩蔽门限。本发明通过采用谱平坦测度函数计算局部掩蔽门限,实现对音频信号的音调掩蔽特性及非音调掩蔽特性进行区分处理,从而可以达到更合理地分配量化比特数,有效地提高量化效率的效果。

    生成心理声学模型的方法及装置

    公开(公告)号:CN102169694B

    公开(公告)日:2012-10-17

    申请号:CN201010123999.0

    申请日:2010-02-26

    IPC分类号: G10L19/02 G10L19/00

    摘要: 本发明公开了一种生成心理声学模型的方法及装置,属于音频处理技术领域。该方法包括:以修正离散余弦变换MDCT对输入的时域音频信号帧进行时频分析,得到MDCT频域参数;根据MDCT频域参数计算谱平坦测度函数、频谱局部最大主导分量扩展包络和频谱局部最小主导分量平均包络,并根据所述谱平坦测度函数、频谱局部最大主导分量扩展包络和频谱局部最小主导分量平均包络计算局部掩蔽门限;根据局部掩蔽门限,生成并输出全局掩蔽门限。本发明通过采用谱平坦测度函数计算局部掩蔽门限,实现对音频信号的音调掩蔽特性及非音调掩蔽特性进行区分处理,从而可以达到更合理地分配量化比特数,有效地提高量化效率的效果。