-
公开(公告)号:CN103035249A
公开(公告)日:2013-04-10
申请号:CN201210456918.8
申请日:2012-11-14
Applicant: 北京理工大学
IPC: G10L19/02 , G10L19/038
Abstract: 本发明涉及一种基于时频平面上下文的音频算术编码方法,其中音频编码参数的概率可自适应,属于音频编码领域。其技术特点是首先对每帧音频信号使用离散余弦变换MDCT和矢量量化,然后对量化后的MDCT系数进行上下文分配和概率建模。此过程对量化MDCT系数首先使用频域上下文,即统计待编码量化MDCT系数的一阶条件频数,在使用频域上下文统计完每个量化MDCT系数的一阶条件频数后,对本帧量化MDCT系数利用本帧之前两帧相关性判断是否使用时域上下文,将最终的一阶条件频数送入算术编码器进行编码。本发明方法能够在保持良好音频编码质量的同时,降低音频信号的平均编码速率,从而提高音频编码器的编码效率。
-
公开(公告)号:CN102044254B
公开(公告)日:2012-11-07
申请号:CN200910235643.3
申请日:2009-10-10
Applicant: 北京理工大学
IPC: G10L21/06
Abstract: 本发明为一种用于语音可视化的语谱图彩色增强方法,包括对原始语音信号分帧、加窗,提取每帧信号在各个特征频带内的短时能量值;将语音信号的有效频带平均分为N个特征频带,分别计算每帧语音信号在N个特征频带内的能量值;以各个特征频带内的能量值为参数对相应特征频带预先设定的色彩饱和度进行修正;对N个频带内的能量值进行归一化处理;利用归一化后的能量值对N特征频带既定色彩的饱和度进行修正;将语音信号N个特征频带的修正后的色相、饱和度、亮度利用色彩学转换公式转化为RGB三原色值;绘制直方图。本发明语音信号色彩生成模块,通过不同色彩反映语音信号频谱的能量集中区域,易于辨识;动态反映出发音的帧间变化,符合发音规律。
-
公开(公告)号:CN102176313A
公开(公告)日:2011-09-07
申请号:CN200910235647.1
申请日:2009-10-10
Applicant: 北京理工大学
IPC: G10L21/06
Abstract: 本发明为一种基于共振峰频率的汉语普通话单韵母语音可视化方法,包括对原始语音信号分帧、加窗,提取每帧信号的短时能量、共振峰频率、基音频率,采用中值平滑方法纠正共振峰频率、基音频率个别数值的错误;利用共振峰频率将不同发音映射为不同色彩方面并修正:在图像上反应发音时间、能量、音调基音频率的变化趋势,利用色彩来区分不同汉语普通话单韵母发音。本发明只提取语音信号的短时能量、共振峰频率、基音频率几个简单的语音声学参数,易于实现;引入软判决,对于每个发音不做硬性判决,而是采用不同色彩表示,不同发音人同一个音的可视化效果求大同而存小异,这使得对于发音的判决更符合人的主观感知。
-
公开(公告)号:CN102044254A
公开(公告)日:2011-05-04
申请号:CN200910235643.3
申请日:2009-10-10
Applicant: 北京理工大学
IPC: G10L21/06
Abstract: 本发明为一种用于语音可视化的语谱图彩色增强方法,包括对原始语音信号分帧、加窗,提取每帧信号在各个特征频带内的短时能量值;将语音信号的有效频带平均分为N个特征频带,分别计算每帧语音信号在N个特征频带内的能量值;以各个特征频带内的能量值为参数对相应特征频带预先设定的色彩饱和度进行修正;对N个频带内的能量值进行归一化处理;利用归一化后的能量值对N特征频带既定色彩的饱和度进行修正;将语音信号N个特征频带的修正后的色相、饱和度、亮度利用色彩学转换公式转化为RGB三原色值;绘制直方图。本发明语音信号色彩生成模块,通过不同色彩反映语音信号频谱的能量集中区域,易于辨识;动态反映出发音的帧间变化,符合发音规律。
-
公开(公告)号:CN101908342A
公开(公告)日:2010-12-08
申请号:CN201010234864.1
申请日:2010-07-23
Applicant: 北京理工大学
Abstract: 本发明公开了一种利用频域滤波后处理进行音频暂态信号预回声抑制的方法,属于音频信号处理领域,特别是在音频编码中对解码后的暂态信号进行噪声整形的后处理方法。该方法由输入的音频暂态信号的离散余弦变换系数获得频域线性预测系数,并由此得到短时后滤波器,对暂态信号的离散余弦变换系数依次进行短时后滤波和谱倾斜补偿滤波,将滤波后的频域变换系数进行离散余弦逆变换恢复得到时域信号,再进行增益调整得到经后处理的暂态信号。本发明通过对音频暂态信号频域上的滤波处理达到时域上的噪声整形效果,有效抑制暂态信号编码造成的预回声失真,增强暂态信号峰值能量,能在不需要消耗额外编码比特的情况下提高解码后音频暂态信号的听音质量。
-
公开(公告)号:CN101656560A
公开(公告)日:2010-02-24
申请号:CN200910093254.1
申请日:2009-09-24
Applicant: 北京理工大学
Abstract: 本发明公开了一种在无线通信领域中提高频谱利用率的协作通信方法,主要解决传统的协作通信系统进行时隙分割造成频谱利用率下降的问题。其实现步骤为:节点A采用映射方案C 1 和C 2 分别调制自己的信息和上一时隙接收到的节点B的信息,将两路调制信号正交叠加在一起并广播出去;节点B分别采用映射方案C 3 和C 4 对本息信息和中继信息进行调制,然后广播叠加的调制符号;目的节点D联合解调接收到两路叠加符号,获得节点A的信息。节点D采用相同的协作通信方法,获得节点B的信息。本发明使得用户节点能同时发送本地信息和中继信息,提高了系统的频谱利用率,在不增加系统复杂度的前提下,进一步改善协作系统的误码性能,保证通信质量。
-
公开(公告)号:CN101587710A
公开(公告)日:2009-11-25
申请号:CN200910088368.7
申请日:2009-07-02
Applicant: 北京理工大学
Abstract: 本发明公开了一种基于音频突发事件分类的多码本编码参数量化方法,属于音频编码技术领域。本方法首先对输入的音频信号逐帧进行暂态检测,然后对检测出的暂态帧进行突发事件分类,最后对得到的音频突发事件的编码参数,进行基于突发事件分类码本的矢量量化,由此实现了音频突发事件的分类和音频突发事件编码参数的量化过程。本发明方法提高了对突发事件编码参数的量化效果,改善了突发事件的编码音质。
-
公开(公告)号:CN101345604A
公开(公告)日:2009-01-14
申请号:CN200810117930.X
申请日:2008-08-15
Applicant: 北京理工大学
Abstract: 本发明是一种行列式分组交织器的并行实现方法,涉及通信技术领域。令行列式分组交织器交织深度为d,交织宽度为n,选取n的任意因数作为并行度p,n=w×p,w为正整数。先用顺序交换器对输入的p比特数据进行顺序交换,接着进行右移循环移位,然后根据写地址产生器产生的p个写地址,将经顺序交换和右移循环移位得到的p比特数据分别写入p个双口RAM(随机存取存储器)中,写完一帧数据后,根据读地址产生器产生的读地址从p个双口RAM中并行读出p比特数据,并对读出的p比特数据进行左移循环移位以得到交织后的数据。本发明可灵活选取并行度p实现并行的行列式分组交织器,从而将数据处理速率提高p倍以满足高速数据传输的应用。
-
公开(公告)号:CN100389421C
公开(公告)日:2008-05-21
申请号:CN200610076775.2
申请日:2006-04-20
Applicant: 北京理工大学
IPC: G06F17/30
Abstract: 本发明涉及一种快速构造用于关键词检出任务的语音数据库的方法。其中执行以下步骤:步骤1,录制孤立词语音数据库;步骤2,根据关键词检出系统的要求确定关键词表和非关键词表;步骤3,确定关键词检出测试数据的参数如总的句子数,时间长度,关键词出现次数等;步骤4,使用波形拼接的方法将符合关键词检出系统要求的关键词和非关键词语音连接成句子,进而生成满足要求的用于关键词检出任务的数据库。本发明实现了利用已有的孤立词语音数据库快速构造用于关键词检出任务的语音数据库的方法,能灵活的根据不同的要求提供相应的语音数据库。
-
公开(公告)号:CN101110214A
公开(公告)日:2008-01-23
申请号:CN200710120142.1
申请日:2007-08-10
Applicant: 北京理工大学
Abstract: 本发明涉及一种基于多描述格型矢量量化的语音编码方法,属于通信领域。本发明主要用于分组语音传输。该算法首先对语音信号进行LPC分析,并进行感知加权,再将加权语音信号变换到频域。在频域,信号被分解成矢量,采用格型矢量量化方法进行量化,最后量化后的格点按照多描述格型矢量量化的标注方法分解成两个描述(相应子格点的索引)在信道中传输,从而提高了系统的传输可靠性。因为该算法基于格型量化技术,算法复杂度和编码延时较低。
-
-
-
-
-
-
-
-
-