专利检索 ap:("华为技术有限公司" OR "西安电子科技大学") AND inv:"郭泽华" 第 1 页

1.

发明公开
生成心理声学模型的方法及装置失效

公开(公告)号：CN102169694A

公开(公告)日：2011-08-31

申请号：CN201010123999.0

申请日：2010-02-26

申请人： 华为技术有限公司 , 西安电子科技大学

发明人： 马鸿飞 , 郭泽华 , 夏雨 , 许丽净

IPC分类号： G10L19/02 , G10L19/00

摘要： 本发明公开了一种生成心理声学模型的方法及装置，属于音频处理技术领域。该方法包括：以修正离散余弦变换MDCT对输入的时域音频信号帧进行时频分析，得到MDCT频域参数；根据MDCT频域参数计算谱平坦测度函数、频谱局部最大主导分量扩展包络和频谱局部最小主导分量平均包络，并根据所述谱平坦测度函数、频谱局部最大主导分量扩展包络和频谱局部最小主导分量平均包络计算局部掩蔽门限；根据局部掩蔽门限，生成并输出全局掩蔽门限。本发明通过采用谱平坦测度函数计算局部掩蔽门限，实现对音频信号的音调掩蔽特性及非音调掩蔽特性进行区分处理，从而可以达到更合理地分配量化比特数，有效地提高量化效率的效果。

2.

发明授权
生成心理声学模型的方法及装置失效

公开(公告)号：CN102169694B

公开(公告)日：2012-10-17

申请号：CN201010123999.0

申请日：2010-02-26

申请人： 华为技术有限公司 , 西安电子科技大学

发明人： 马鸿飞 , 郭泽华 , 夏雨 , 许丽净

IPC分类号： G10L19/02 , G10L19/00

摘要： 本发明公开了一种生成心理声学模型的方法及装置，属于音频处理技术领域。该方法包括：以修正离散余弦变换MDCT对输入的时域音频信号帧进行时频分析，得到MDCT频域参数；根据MDCT频域参数计算谱平坦测度函数、频谱局部最大主导分量扩展包络和频谱局部最小主导分量平均包络，并根据所述谱平坦测度函数、频谱局部最大主导分量扩展包络和频谱局部最小主导分量平均包络计算局部掩蔽门限；根据局部掩蔽门限，生成并输出全局掩蔽门限。本发明通过采用谱平坦测度函数计算局部掩蔽门限，实现对音频信号的音调掩蔽特性及非音调掩蔽特性进行区分处理，从而可以达到更合理地分配量化比特数，有效地提高量化效率的效果。