一种基于语音前端噪声消除的提高语音识别准确率的方法

    公开(公告)号:CN104064196B

    公开(公告)日:2017-08-01

    申请号:CN201410281240.3

    申请日:2014-06-20

    Inventor: 刘明 王明江

    Abstract: 本发明为大规模孤立词语音识别提供了一种基于语音前端处理消除噪声从而提高识别准确率的方法,本发明的方法解决了由于含有噪声在MFCC提取过程中语音端点检测错误导致识别准确率低的问题。计算听觉场景分析(CASA)用于语音识别的前端,相比于降噪、语音增强等传统去噪方法,通过模拟人耳的听觉神经系统,可以有效的将噪声从带噪语音中分离出来。本发明中对10240个带噪语音进行识别,相比于不进行前端噪声处理,识别的准确率由83%提高到了95.5%。

    一种基于语音帧间动态信息提高语音识别鲁棒性的方法

    公开(公告)号:CN104064197B

    公开(公告)日:2017-05-17

    申请号:CN201410281239.0

    申请日:2014-06-20

    Inventor: 刘明 王明江

    Abstract: 本发明为大规模孤立词语音识别提供了一种提高识别鲁棒性的方法。本发明的方法引入了不同语音帧之间的相关性,为语音识别的特征参数加入了动态特征。同时通过CASA方法将噪声环境下的语音进行了噪声消除,扩大了语音识别应用领域的范围。本发明待识别孤立词为10240词,实验结果表明,在将语音帧间信息作为动态参数加入到语音特征参数后,平均每个词汇的第一识别概率和第二识别概率的差值增大了30%。

    一种语音识别的特征向量量化快速收敛方法

    公开(公告)号:CN104064181B

    公开(公告)日:2017-04-19

    申请号:CN201410281283.1

    申请日:2014-06-20

    Inventor: 刘明 王明江

    Abstract: 本发明为大规模孤立词语音识别的特征向量量化提供了一种快速收敛的方法,能比较快的建立码本。本发明的方法解决了一般特征向量由于词汇量大而导致码本建立过程慢的缺点,实验结果表明,相比较于模拟退火算法,该发明的码本建立过程中运算的迭代次数减小了一个10的量级,同时消除了除法运算和大量的乘法运算。

    一种配流盘压力缓冲槽流量压力特性测试实验装置

    公开(公告)号:CN103883510B

    公开(公告)日:2016-04-13

    申请号:CN201410155579.9

    申请日:2014-04-17

    Abstract: 一种配流盘压力缓冲槽流量压力特性测试实验装置,它涉及一种流量压力特性测试实验装置,以解决现有采用经验值法计算柱塞泵中配流盘压力缓冲槽流量压力特性不准确的问题,它包括液压泵、第一溢流阀、第二溢流阀、第一压力传感器、第一温度传感器、第二压力传感器、第二温度传感器、节流装置、流量传感器、节流阀、电磁换向阀、地脚和储液箱;与通道连通的管道上安装有第一压力传感器和第一温度传感器,第一溢流阀与液压泵并联设置后通过电磁换向阀与第一温度传感器连通;与流道连通的管道上安装有第二压力传感器、第二温度传感器,第二溢流阀与节流阀并联设置后与流量传感器连通。本发明用于轴向柱塞泵配流盘上缓冲槽流量压力特性测试。

    一种用于前景检测的码本改进算法

    公开(公告)号:CN105139372A

    公开(公告)日:2015-12-09

    申请号:CN201510066698.1

    申请日:2015-02-06

    Abstract: 本发明提出了一种在像素运动统计中用于确定像素类型的码本改进算法,优化了传统码本的需要图像M帧建立背景模型的不足,利用图像第一帧,以像素点领域内的信息作为码本的统计码元。不仅在建模阶段利用像素的时空域信息,在寻找匹配码元,进行背景更新时,也充分利用领域内的码本,并引入随机更新背景的概念,优越于传统的背景更新,与传统码本相比,本发明提出的用于前景检测的码本改进算法改善前景检测的正确率,并提高了建模阶段的效率。

    一种改进的背景建模及前景检测方法

    公开(公告)号:CN104680521A

    公开(公告)日:2015-06-03

    申请号:CN201510065105.X

    申请日:2015-02-06

    Abstract: 本发明提出了一种改进的背景建模及前景检测方法,首先建立背景模型,然后判断当前帧的每一像素点属于背景点还是前景点,接着更新背景集,最后利用上述流程对每一图像帧进行逐像素判断,最终得到前景与背景分离的二值图像,从而从监控视频中分割前景运动目标。本发明的方法克服了传统目标检测方法的一些缺点,提高了检测适应性、稳定性及实时性等。

    一种基于语音帧间动态信息提高语音识别鲁棒性的方法

    公开(公告)号:CN104064197A

    公开(公告)日:2014-09-24

    申请号:CN201410281239.0

    申请日:2014-06-20

    Inventor: 刘明 王明江

    Abstract: 本发明为大规模孤立词语音识别提供了一种提高识别鲁棒性的方法。本发明的方法引入了不同语音帧之间的相关性,为语音识别的特征参数加入了动态特征。同时通过CASA方法将噪声环境下的语音进行了噪声消除,扩大了语音识别应用领域的范围。本发明待识别孤立词为10240词,实验结果表明,在将语音帧间信息作为动态参数加入到语音特征参数后,平均每个词汇的第一识别概率和第二识别概率的差值增大了30%。

    一种语音识别的特征向量量化快速收敛方法

    公开(公告)号:CN104064181A

    公开(公告)日:2014-09-24

    申请号:CN201410281283.1

    申请日:2014-06-20

    Inventor: 刘明 王明江

    Abstract: 本发明为大规模孤立词语音识别的特征向量量化提供了一种快速收敛的方法,能比较快的建立码本。本发明的方法解决了一般特征向量由于词汇量大而导致码本建立过程慢的缺点,实验结果表明,相比较于模拟退火算法,该发明的码本建立过程中运算的迭代次数减小了一个10的量级,同时消除了除法运算和大量的乘法运算。

    一种基于动态HMM事件数的提高语音识别准确率的方法

    公开(公告)号:CN104064179A

    公开(公告)日:2014-09-24

    申请号:CN201410281284.6

    申请日:2014-06-20

    Inventor: 刘明 王明江

    Abstract: 本发明为大规模孤立词语音识别提供了一种提高识别准确率的方法,针对不同的孤立词建立了隐马尔科夫模型(HMM)参数自适应变化的机制,解决了不同的孤立词因HMM概率模型中事件数相同而识别准确率和识别鲁棒性低的问题。实验结果表明,本发明的方法在稍许增加识别计算量的前提下,有效地提高了大规模孤立词语音识别的准确率。待识别孤立词为5120词时,多次识别准确率的平均值由91%提高到了97.3%;待识别孤立词为10240词时,多次识别准确率的平均值由87%提高到了96.3%。相比于传统的基于统计概率的静态模型的语音识别,采用本发明方法的优势在于针对不同用户自适应的调整识别模型的参数,从而提高识别的准确率。

Patent Agency Ranking