一种基于多频带特征补偿的鲁棒语音识别方法

    公开(公告)号:CN106356058B

    公开(公告)日:2019-08-20

    申请号:CN201610809744.7

    申请日:2016-09-08

    Applicant: 河海大学

    Inventor: 吕勇

    Abstract: 本发明公开一种基于多频带特征补偿的鲁棒语音识别方法,首先对噪声环境下提取的美尔频率倒谱系数(MFCC)在倒谱域直接进行分解,得到四个频带的子MFCC;然后,在各个频带上用预先训练的高斯混合模型对本频带的子MFCC进行特征补偿,得到较为纯净的子特征参数;最后,对估得的四个频带的子MFCC进行特征组合,得到纯净语音的完整MFCC。本发明可以提高带限噪声环境下语音识别系统的识别性能,提高系统的噪声鲁棒性。

    一种基于GMM噪声估计的模型组合语音识别方法

    公开(公告)号:CN105355199B

    公开(公告)日:2019-03-12

    申请号:CN201510686426.1

    申请日:2015-10-20

    Applicant: 河海大学

    Inventor: 吕勇

    Abstract: 本发明公开一种基于GMM噪声估计的模型组合语音识别方法,用一个含有较少高斯单元的GMM从含噪测试语音中实时估计噪声参数,并监控噪声的变化。噪声参数估计按时间间隔进行,每个时间间隔更新一次噪声参数,静音段也当作含噪语音处理。估得的噪声参数除了用于模型组合,还存储在内部存储器中,用于下一个时间间隔的噪声变化判断。在噪声监控中,首先从存储器中读取上一个时间间隔的噪声参数,然后与纯净语音GMM组合,得到含噪语音GMM,并对当前时间间隔的含噪测试语音进行概率计算,将输出的平均对数似然值与噪声参数估计子模块输出的平均对数似然值进行比较,若似然差大于阈值,则认为噪声发生了变化,否则就认为噪声不变。

    一种基于子带信噪比加权的倒谱域基音周期估计方法

    公开(公告)号:CN109346106A

    公开(公告)日:2019-02-15

    申请号:CN201811035434.X

    申请日:2018-09-06

    Applicant: 河海大学

    Inventor: 吕勇

    Abstract: 本发明公开了一种基于子带信噪比加权的倒谱域基音周期估计方法,利用含噪语音的Mel谱计算子带加权系数,在对数谱域对每个Mel子带上的所有含噪语音对数谱进行子带加权,在倒谱域进行峰值检测,估计含噪语音信号的基音周期。本发明的技术方案可以同时对环境噪声和声道共振峰进行抑制,得到较为准确的基音周期估计值,尤其适合低信噪比环境下的基音估计。

    一种基于子带谱熵的语音增强方法

    公开(公告)号:CN109102823A

    公开(公告)日:2018-12-28

    申请号:CN201811031344.3

    申请日:2018-09-05

    Applicant: 河海大学

    Inventor: 吕勇

    Abstract: 本发明公开了一种基于子带谱熵的语音增强方法,首先将含噪语音的幅度谱划分成若干个子带,计算每个子带的谱熵;然后,根据子带谱熵,判断该子带是否存在语音;最后,对无音子带,更新该子带上所有数字频率处的噪声参数;对有音子带,用谱减法对含噪语音的幅度谱进行增强。本发明可以对每一帧信号的每个子带的语音存在性进行判断,增强噪声估计算法对非平稳环境的实时跟踪能力。

    一种基于改进和声搜索算法的5G通信系统资源分配方法

    公开(公告)号:CN109039494A

    公开(公告)日:2018-12-18

    申请号:CN201810823100.2

    申请日:2018-07-25

    Applicant: 河海大学

    Abstract: 本发明公开了一种基于改进和声搜索算法的5G通信系统资源分配方法,该方法包括:初始化系统参数,将用户复用信道资源的方案用一组和声来表示;初始化初始解空间,根据和声记忆库取值概率判别是否从初始解空间内产生新的和声变量;以系统吞吐量、蜂窝用户的平均发射功率以及终端能效中的至少一个为优化目标,计算每个和声对应的目标函数;根据目标函数将新解与和声记忆库中的解排序,选择最优的解作为新的解;当继续迭代未能得到显著优化的目标函数值时,则停止迭代,对码空间进行逆向解码得到最优资源分配方案。本发明能有效提高系统吞吐量、降低蜂窝用户的发射功率、提升终端能效,其性能优越,且易于实现。

    一种基于双特征模型的鲁棒语音识别方法

    公开(公告)号:CN108022588A

    公开(公告)日:2018-05-11

    申请号:CN201711112809.3

    申请日:2017-11-13

    Applicant: 河海大学

    Inventor: 吕勇

    Abstract: 本发明公开一种基于双特征模型的鲁棒语音识别方法,针对语音的低能量系数容易被噪声覆盖的特点,用幂函数取代对数函数,对含噪输入语音的Mel谱系数进行压缩,得到含噪语音的幂美尔频率倒谱系数(PMFCC:Power Mel Frequency Cepstral Coefficients),并根据含噪输入语音对声学模型的参数进行变换,使其与当前环境相匹配;如果输入语音是纯净测试语音,则仍采用传统的MFCC进行声学解码。本发明可以在保持纯净输入语音高识别率的同时,提高含噪语音的抗噪声能力,优于传统的单MFCC语音识别系统。

    一种基于非线性特征补偿的鲁棒语音识别方法

    公开(公告)号:CN107818780A

    公开(公告)日:2018-03-20

    申请号:CN201711112816.3

    申请日:2017-11-13

    Applicant: 河海大学

    Inventor: 吕勇

    Abstract: 本发明公开一种基于非线性特征补偿的鲁棒语音识别方法,假设每个Mel通道上的语音特征参数只受本通道噪声的影响,通过含噪语音和纯净语音之间的非线性变换关系对本通道的含噪语音特征参数进行变换,得到与纯净语音声学模型相匹配的测试语音特征参数。用于每个Mel通道非线性特征变换的噪声参数通过使本通道GMM的输出概率最大来确定。本发明的技术方案对噪声环境下提取的含噪语音特征进行非线性补偿,具有运算量小、灵活性好、与后端识别器无关的优点。

    一种基于对数谱信噪比加权的鲁棒特征提取方法

    公开(公告)号:CN106373559A

    公开(公告)日:2017-02-01

    申请号:CN201610808691.7

    申请日:2016-09-08

    Applicant: 河海大学

    Inventor: 吕勇

    Abstract: 本发明公开一种基于对数谱信噪比加权的鲁棒特征提取方法,首先,对输入语音进行声学预处理、短时谱估计和Mel滤波,得到每一帧的短时Mel子带谱;再利用改进的对数函数对Mel子带谱进行非线性变换,得到对数谱,同时从Mel子带谱中估计输入语音的对数谱域信噪比;然后,利用估得的对数谱域后验信噪比对输入语音的对数谱进行加权,得到加权对数谱;最后,对加权对数谱进行离散余弦变换并作时域差分,得到输入语音的特征参数。本发明提高了噪声环境中提取的特征参数的环境鲁棒性,减小加性噪声对语音识别系统的影响,具有计算量较小、易于实时实现的优点。

    一种基于多频带特征补偿的鲁棒语音识别方法

    公开(公告)号:CN106356058A

    公开(公告)日:2017-01-25

    申请号:CN201610809744.7

    申请日:2016-09-08

    Applicant: 河海大学

    Inventor: 吕勇

    Abstract: 本发明公开一种基于多频带特征补偿的鲁棒语音识别方法,首先对噪声环境下提取的美尔频率倒谱系数(MFCC)在倒谱域直接进行分解,得到四个频带的子MFCC;然后,在各个频带上用预先训练的高斯混合模型对本频带的子MFCC进行特征补偿,得到较为纯净的子特征参数;最后,对估得的四个频带的子MFCC进行特征组合,得到纯净语音的完整MFCC。本发明可以提高带限噪声环境下语音识别系统的识别性能,提高系统的噪声鲁棒性。

    一种基于GMM噪声估计的模型组合语音识别方法

    公开(公告)号:CN105355199A

    公开(公告)日:2016-02-24

    申请号:CN201510686426.1

    申请日:2015-10-20

    Applicant: 河海大学

    Inventor: 吕勇

    CPC classification number: G10L15/144

    Abstract: 本发明公开一种基于GMM噪声估计的模型组合语音识别方法,用一个含有较少高斯单元的GMM从含噪测试语音中实时估计噪声参数,并监控噪声的变化。噪声参数估计按时间间隔进行,每个时间间隔更新一次噪声参数,静音段也当作含噪语音处理。估得的噪声参数除了用于模型组合,还存储在内部存储器中,用于下一个时间间隔的噪声变化判断。在噪声监控中,首先从存储器中读取上一个时间间隔的噪声参数,然后与纯净语音GMM组合,得到含噪语音GMM,并对当前时间间隔的含噪测试语音进行概率计算,将输出的平均对数似然值与噪声参数估计子模块输出的平均对数似然值进行比较,若似然差大于阈值,则认为噪声发生了变化,否则就认为噪声不变。

Patent Agency Ranking