-
公开(公告)号:CN103928030B
公开(公告)日:2017-03-15
申请号:CN201410181636.0
申请日:2014-04-30
Applicant: 武汉大学
IPC: G10L19/008 , G10L19/002
Abstract: 本发明提供一种基于子带空间关注测度的可分级音频编码系统及方法,包括基于能量、频率和空间信息综合计算各子带的子带重要性测度并排序,根据综合测度的排序结果进行比特分配、残差量化编码,对子带排序编号的编码结果和残差量化编码都加入码流。本发明根据能量、频率和空间信息作为子带优先级分配策略,相比单纯利用能量或频率作为感知测度具有更明显的指导意义。
-
公开(公告)号:CN102385862A
公开(公告)日:2012-03-21
申请号:CN201110263436.6
申请日:2011-09-07
Applicant: 武汉大学
Abstract: 本发明涉及数字水印技术领域,提出一种面向空气信道传播的音频数字水印方法。该方法循环嵌入水印信息和同步信号。本发明不仅能够有效抵抗AD/DA变换以及空气背景噪声干扰,还能抵抗空气信道传播时受播放距离、播放角度、播放音量等其他因素的干扰,并且能够抵抗常见信号处理攻击、重采样攻击、MP3压缩攻击,以及基于StriMarkBenchmarkforAudio的攻击,误码率较低,具有较好的稳健性和鲁棒性,能够适用于空气信道传播的实际场景,为机密网络会议的泄密追踪提供新的技术保障。
-
公开(公告)号:CN103400582B
公开(公告)日:2015-09-16
申请号:CN201310351242.0
申请日:2013-08-13
Applicant: 武汉大学
IPC: G10L19/008
Abstract: 本发明公开了一种面向多声道三维音频的编解码方法与系统,包括时频变换模块、子带划分模块、子带能量计算模块、变换模块,子带能量还原模块、子带合成模块和频时变换模块。编码端,将输入声道的时域信号变换为频域信号,并将各声道的频域信号信号划分为子带,计算各子带能量;将相邻三个声道对应的子带能量组合成声道单元,分析声道单元中各子带能量并根据分析结果选择变换矩阵;在解码端,通过变换矩阵索引,还原声道单元,并获得各声道的频域信号,通过频时变换得到各声道的域信号,从而最大无失真地完成了原始声道信号的还原。本发明可实现声道间冗余信息的去除,且具有低复杂度和高效率的特点,适用于三维音频直播通信传输的要求。
-
公开(公告)号:CN102682779B
公开(公告)日:2013-07-24
申请号:CN201210183963.0
申请日:2012-06-06
Applicant: 武汉大学
IPC: G10L19/008 , G10L21/0208 , H04S1/00
Abstract: 本发明提供了一种面向3D音频的双声道编解码方法和编解码器,本发明在面向3D音频的双声道技术基础上,根据人耳听觉特性,将更多的编码能量用于编码的主成分中,并针对不同的音频信号采用不同的编码方法进行编码,进而提出一种面向3D音频的双声道编解码方法及相应的编解码器。本发明方法能降低编解码噪音,使重建信号具有更高的信噪比,同时能更好的模拟3D音频信号。
-
公开(公告)号:CN102737647A
公开(公告)日:2012-10-17
申请号:CN201210254813.4
申请日:2012-07-23
Applicant: 武汉大学
Abstract: 本发明提出了一种双声道音频音质增强编解码方法和相应装置,将频谱差异较大的子带提取出来做线性预测分析,并在解码时对解出的信号的频谱进行修正。本发明在面向双声道技术基础上,解决了由于双声道间存在较大差异,进行下混和参数编码时的失真问题;增强了音频编码质量,使重建信号具有更完整的频谱信息。
-
公开(公告)号:CN102682779A
公开(公告)日:2012-09-19
申请号:CN201210183963.0
申请日:2012-06-06
Applicant: 武汉大学
Abstract: 本发明提供了一种面向3D音频的双声道编解码方法和编解码器,本发明在面向3D音频的双声道技术基础上,根据人耳听觉特性,将更多的编码能量用于编码的主成分中,并针对不同的音频信号采用不同的编码方法进行编码,进而提出一种面向3D音频的双声道编解码方法及相应的编解码器。本发明方法能降低编解码噪音,使重建信号具有更高的信噪比,同时能更好的模拟3D音频信号。
-
公开(公告)号:CN102254561A
公开(公告)日:2011-11-23
申请号:CN201110236913.X
申请日:2011-08-18
Applicant: 武汉大学
IPC: G10L19/00
Abstract: 本发明涉及信息隐写技术领域,提出了一种基于空间线索的音频信息隐写方法。该方法包括:音源分离步骤,对输入的多声道立体声音频信号进行音源分离,得到各个分离音源信号以及每个音源的空间线索信息;信息隐写步骤,对每个分离音源信号分别进行信息隐写操作;音频合成步骤,利用各分离音源信号对应的空间线索,将已经嵌入隐写信息的分离音源信号还原为多声道音频信号。本发明通过分离音频后进行信息隐写,从而在提高信息的隐藏效果同时,在数量级的程度上增大隐写信息的嵌入量。
-
公开(公告)号:CN101695000A
公开(公告)日:2010-04-14
申请号:CN200910272395.X
申请日:2009-10-13
Applicant: 武汉大学
Abstract: 本发明提供了一种基于高斯混合模型的分裂矢量量化编解码方法,以及相应两个装置。其中编码装置包括高斯混合模型参数训练模块、归一化无偏估计模块、量化器比特数分配模块、矢量分裂模块、子矢量比特数分配模块、矢量量化模块、编码逆量化模块、编码子矢量合并模块、失真计算模块、最小值判断模块、最小失真量化索引获取模块、码流写入模块;解码装置包括码流读取模块、解码逆量化模块、解码子矢量合并模块、高斯模型参数获取模块、逆归一化无偏估计模块。本发明所提供技术方案能够在低存储空间的条件下,实现对高维矢量进行的基于高斯混合模型的分裂矢量量化。
-
公开(公告)号:CN103928030A
公开(公告)日:2014-07-16
申请号:CN201410181636.0
申请日:2014-04-30
Applicant: 武汉大学
IPC: G10L19/008 , G10L19/002
Abstract: 本发明提供一种基于子带空间关注测度的可分级音频编码系统及方法,包括基于能量、频率和空间信息综合计算各子带的子带重要性测度并排序,根据综合测度的排序结果进行比特分配、残差量化编码,对子带排序编号的编码结果和残差量化编码都加入码流。本发明根据能量、频率和空间信息作为子带优先级分配策略,相比单纯利用能量或频率作为感知测度具有更明显的指导意义。
-
公开(公告)号:CN103400582A
公开(公告)日:2013-11-20
申请号:CN201310351242.0
申请日:2013-08-13
Applicant: 武汉大学
IPC: G10L19/008
Abstract: 本发明公开了一种面向多声道三维音频的编解码方法与系统,包括时频变换模块、子带划分模块、子带能量计算模块、变换模块,子带能量还原模块、子带合成模块和频时变换模块。编码端,将输入声道的时域信号变换为频域信号,并将各声道的频域信号信号划分为子带,计算各子带能量;将相邻三个声道对应的子带能量组合成声道单元,分析声道单元中各子带能量并根据分析结果选择变换矩阵;在解码端,通过变换矩阵索引,还原声道单元,并获得各声道的频域信号,通过频时变换得到各声道的域信号,从而最大无失真地完成了原始声道信号的还原。本发明可实现声道间冗余信息的去除,且具有低复杂度和高效率的特点,适用于三维音频直播通信传输的要求。
-
-
-
-
-
-
-
-
-