一种基于动态HMM观察符号数的提高语音识别准确率的方法

    公开(公告)号:CN104064183B

    公开(公告)日:2017-12-08

    申请号:CN201410279788.4

    申请日:2014-06-20

    Inventor: 刘明 王明江

    Abstract: 本发明为大规模孤立词语音识别提供了一种提高识别准确率的方法,本发明的方法针对不同的孤立词动态的建立了隐马尔科夫模型观察符号数,解决了不同的孤立词因观察符号数相同而识别准确率低的问题。实验结果表明,本发明的方法在稍许增加识别计算量的前提下,有效地提高了大规模孤立词语音识别的准确率。本发明的方法可以动态调整识别模型的参数,相比于传统的基于统计概率的静态模型的语音识别,采用本发明方法的优势在于针对不同用户自适应的调整识别模型的参数,从而提高识别的准确率。待识别孤立词为10240词,实验结果表明,本发明的方法将总的识别率的平均值由96.3%提高到了99.2%。

    一种分部处理式阵列式语音定位和增强方法

    公开(公告)号:CN104715758A

    公开(公告)日:2015-06-17

    申请号:CN201510066532.X

    申请日:2015-02-06

    Abstract: 本发明提出了一种分部处理式阵列式语音定位和增强方法,包括广义旁瓣抵消器的基本结构、阻塞矩阵(Block Matrix)的设计、分量滤波器的设计和外置维纳滤波部分。该方法借鉴分量结构,外加后置维纳滤波器,利用部分自适应技术,保证了算法的去噪性能,有效地抑制非相干噪声和相干噪声,加快了算法的收敛速度,降低了运算复杂度,相对于传统的广义旁瓣相消器的麦克风阵列语音增强系统,采用改进的语音增强系统具有更高的输出信噪比。仿真实验测试结构表明,相对于基于全带广义旁瓣抵消器的麦克风阵列语音增强系统,本发明的方法具有更高的输出信噪比。

    一种处于噪声条件下的数字助听器宽动态压缩算法

    公开(公告)号:CN104703108B

    公开(公告)日:2018-04-03

    申请号:CN201510066821.X

    申请日:2015-02-06

    Abstract: 本发明提出了一种本发明是在噪声环境中为数字助听器的宽动态压缩算法,包括以下步骤:步骤A:根据语音增强算法,输出去噪之后的语音信号;步骤B:语音信号输出反馈路径的估算:边界检查计算、根据自适应宽动态压缩3条规则的计算输出;步骤C:把步骤A和步骤B的输出作为宽动态压缩模块的输入,进行语音信号压缩放大,并提高信噪比。传统的压缩算法当外界声源的声压级大小小于正常人的听阈时,助听器一般不启动压缩算法,而让输出声压级大小为0,这样就丢失了音频信号一部分的信息。本发明将对这个过程改进和优化,保留之前输入声压级小于正常人听阈的那部分声音信号的信息,同时本发明还带有噪声消除功能。

    一种基于语音前端噪声消除的提高语音识别准确率的方法

    公开(公告)号:CN104064196B

    公开(公告)日:2017-08-01

    申请号:CN201410281240.3

    申请日:2014-06-20

    Inventor: 刘明 王明江

    Abstract: 本发明为大规模孤立词语音识别提供了一种基于语音前端处理消除噪声从而提高识别准确率的方法,本发明的方法解决了由于含有噪声在MFCC提取过程中语音端点检测错误导致识别准确率低的问题。计算听觉场景分析(CASA)用于语音识别的前端,相比于降噪、语音增强等传统去噪方法,通过模拟人耳的听觉神经系统,可以有效的将噪声从带噪语音中分离出来。本发明中对10240个带噪语音进行识别,相比于不进行前端噪声处理,识别的准确率由83%提高到了95.5%。

    一种基于语音帧间动态信息提高语音识别鲁棒性的方法

    公开(公告)号:CN104064197B

    公开(公告)日:2017-05-17

    申请号:CN201410281239.0

    申请日:2014-06-20

    Inventor: 刘明 王明江

    Abstract: 本发明为大规模孤立词语音识别提供了一种提高识别鲁棒性的方法。本发明的方法引入了不同语音帧之间的相关性,为语音识别的特征参数加入了动态特征。同时通过CASA方法将噪声环境下的语音进行了噪声消除,扩大了语音识别应用领域的范围。本发明待识别孤立词为10240词,实验结果表明,在将语音帧间信息作为动态参数加入到语音特征参数后,平均每个词汇的第一识别概率和第二识别概率的差值增大了30%。

    一种语音识别的特征向量量化快速收敛方法

    公开(公告)号:CN104064181B

    公开(公告)日:2017-04-19

    申请号:CN201410281283.1

    申请日:2014-06-20

    Inventor: 刘明 王明江

    Abstract: 本发明为大规模孤立词语音识别的特征向量量化提供了一种快速收敛的方法,能比较快的建立码本。本发明的方法解决了一般特征向量由于词汇量大而导致码本建立过程慢的缺点,实验结果表明,相比较于模拟退火算法,该发明的码本建立过程中运算的迭代次数减小了一个10的量级,同时消除了除法运算和大量的乘法运算。

    一种用于前景检测的码本改进算法

    公开(公告)号:CN105139372A

    公开(公告)日:2015-12-09

    申请号:CN201510066698.1

    申请日:2015-02-06

    Abstract: 本发明提出了一种在像素运动统计中用于确定像素类型的码本改进算法,优化了传统码本的需要图像M帧建立背景模型的不足,利用图像第一帧,以像素点领域内的信息作为码本的统计码元。不仅在建模阶段利用像素的时空域信息,在寻找匹配码元,进行背景更新时,也充分利用领域内的码本,并引入随机更新背景的概念,优越于传统的背景更新,与传统码本相比,本发明提出的用于前景检测的码本改进算法改善前景检测的正确率,并提高了建模阶段的效率。

    一种改进的背景建模及前景检测方法

    公开(公告)号:CN104680521A

    公开(公告)日:2015-06-03

    申请号:CN201510065105.X

    申请日:2015-02-06

    Abstract: 本发明提出了一种改进的背景建模及前景检测方法,首先建立背景模型,然后判断当前帧的每一像素点属于背景点还是前景点,接着更新背景集,最后利用上述流程对每一图像帧进行逐像素判断,最终得到前景与背景分离的二值图像,从而从监控视频中分割前景运动目标。本发明的方法克服了传统目标检测方法的一些缺点,提高了检测适应性、稳定性及实时性等。

    一种基于语音帧间动态信息提高语音识别鲁棒性的方法

    公开(公告)号:CN104064197A

    公开(公告)日:2014-09-24

    申请号:CN201410281239.0

    申请日:2014-06-20

    Inventor: 刘明 王明江

    Abstract: 本发明为大规模孤立词语音识别提供了一种提高识别鲁棒性的方法。本发明的方法引入了不同语音帧之间的相关性,为语音识别的特征参数加入了动态特征。同时通过CASA方法将噪声环境下的语音进行了噪声消除,扩大了语音识别应用领域的范围。本发明待识别孤立词为10240词,实验结果表明,在将语音帧间信息作为动态参数加入到语音特征参数后,平均每个词汇的第一识别概率和第二识别概率的差值增大了30%。

Patent Agency Ranking