-
公开(公告)号:CN103325375B
公开(公告)日:2016-05-04
申请号:CN201310224360.5
申请日:2013-06-05
Applicant: 上海交通大学
IPC: G10L19/06
Abstract: 本发明提供一种改进的基于线性预测参数编码基本原理的极低码率语音编解码设备及编解码方法,充分利用参数的帧内、帧间以及各参数之间的相关性,应用矢量量化技术对编码器的各项参数进行压缩;并在压缩的同时充分利用人耳的听觉感知特性,对各项参数采用不同的加权失真度量进行量化或反量化,从而在不影响人耳听觉质量的前提下对数据进行更高效地压缩。本发明以尽可能低的算法复杂度,在保证语音质量的前提下,实现了能工作在600bps和300bps两种码率的极低码率语音编解码。
-
公开(公告)号:CN106203624A
公开(公告)日:2016-12-07
申请号:CN201610466518.3
申请日:2016-06-23
Applicant: 上海交通大学
IPC: G06N3/08
Abstract: 本发明提出一种基于深度神经网络的矢量量化系统及方法,包括:归一化预处理模块,将原始数据通过归一化数据进行归一化处理,输出归一化后的预处理数据;矢量量化编码模块,用以接收预处理数据及码本,并通过码本对所述预处理数据进行矢量量化编码,输出编码数据;神经网络反量化模块,通过深度神经网络对编码数据进行解码反量化,输出解码数据;反归一化后处理模块,通过归一化数据对解码数据进行反归一化处理,输出反归一化后的还原原始数据;及神经网络训练模块,通过归一化预处理后的预处理训练数据和编码训练数据,进行神经网络的训练,输出深度神经网络至神经网络反量化模块中。本发明能有效解决高维度信号矢量量化的量化误差较大的问题。
-
公开(公告)号:CN103854655B
公开(公告)日:2016-10-19
申请号:CN201310732544.2
申请日:2013-12-26
Applicant: 上海交通大学
IPC: G10L19/16
Abstract: 本发明涉及一种低码率语音编码器包括语音信号预处理模块,梅尔倒谱系数提取模块以及参数量化模块。本发明还涉及一种低码率语音解码器包括:参数反量化模块,幅度谱重建模块,最小相位信号重建模块,GMM特征提取及参数训练系统,清浊音估计模块,基音估计模块,Rosenberg脉冲产生模块,语音信号重建模块以及叠接相加模块。本发明采用基于人耳听觉模型的梅尔倒谱系数作为编解码参数,使得编解码器可以有效去除非人耳听觉范围内的冗余信息。本发明提出在编码器无需计算清浊音和基音信息,只需在解码器基于梅尔倒谱系数通过估计算法得到,不仅有能降低编码器的算法复杂度,还进一步有效减小所要量化传输的参数。
-
公开(公告)号:CN106203624B
公开(公告)日:2019-06-21
申请号:CN201610466518.3
申请日:2016-06-23
Applicant: 上海交通大学
IPC: G06N3/08
Abstract: 本发明提出一种基于深度神经网络的矢量量化系统及方法,包括:归一化预处理模块,将原始数据通过归一化数据进行归一化处理,输出归一化后的预处理数据;矢量量化编码模块,用以接收预处理数据及码本,并通过码本对所述预处理数据进行矢量量化编码,输出编码数据;神经网络反量化模块,通过深度神经网络对编码数据进行解码反量化,输出解码数据;反归一化后处理模块,通过归一化数据对解码数据进行反归一化处理,输出反归一化后的还原原始数据;及神经网络训练模块,通过归一化预处理后的预处理训练数据和编码训练数据,进行神经网络的训练,输出深度神经网络至神经网络反量化模块中。本发明能有效解决高维度信号矢量量化的量化误差较大的问题。
-
公开(公告)号:CN103854655A
公开(公告)日:2014-06-11
申请号:CN201310732544.2
申请日:2013-12-26
Applicant: 上海交通大学
Abstract: 本发明涉及一种低码率语音编码器包括语音信号预处理模块,梅尔倒谱系数提取模块以及参数量化模块。本发明还涉及一种低码率语音解码器包括:参数反量化模块,幅度谱重建模块,最小相位信号重建模块,GMM特征提取及参数训练系统,清浊音估计模块,基音估计模块,Rosenberg脉冲产生模块,语音信号重建模块以及叠接相加模块。本发明采用基于人耳听觉模型的梅尔倒谱系数作为编解码参数,使得编解码器可以有效去除非人耳听觉范围内的冗余信息。本发明提出在编码器无需计算清浊音和基音信息,只需在解码器基于梅尔倒谱系数通过估计算法得到,不仅有能降低编码器的算法复杂度,还进一步有效减小所要量化传输的参数。
-
公开(公告)号:CN103325375A
公开(公告)日:2013-09-25
申请号:CN201310224360.5
申请日:2013-06-05
Applicant: 上海交通大学
IPC: G10L19/06
Abstract: 本发明提供一种改进的基于线性预测参数编码基本原理的极低码率语音编解码设备及编解码方法,充分利用参数的帧内、帧间以及各参数之间的相关性,应用矢量量化技术对编码器的各项参数进行压缩;并在压缩的同时充分利用人耳的听觉感知特性,对各项参数采用不同的加权失真度量进行量化或反量化,从而在不影响人耳听觉质量的前提下对数据进行更高效地压缩。本发明以尽可能低的算法复杂度,在保证语音质量的前提下,实现了能工作在600bps和300bps两种码率的极低码率语音编解码。
-
-
-
-
-