-
公开(公告)号:CN104680521B
公开(公告)日:2018-04-06
申请号:CN201510065105.X
申请日:2015-02-06
Applicant: 哈尔滨工业大学深圳研究生院
Abstract: 本发明提出了一种改进的背景建模及前景检测方法,首先建立背景模型,然后判断当前帧的每一像素点属于背景点还是前景点,接着更新背景集,最后利用上述流程对每一图像帧进行逐像素判断,最终得到前景与背景分离的二值图像,从而从监控视频中分割前景运动目标。本发明的方法克服了传统目标检测方法的一些缺点,提高了检测适应性、稳定性及实时性等。
-
公开(公告)号:CN104754485A
公开(公告)日:2015-07-01
申请号:CN201510066503.3
申请日:2015-02-06
Applicant: 哈尔滨工业大学深圳研究生院
IPC: H04R25/00
Abstract: 本发明提出了一种基于NLMS算法改进的数字助听器回波抵消方法,该方法的主要思想是在M大小的块中,每个输入数据对间隔M的共N/M个系数进行更新,当输入M个数据后,实现自适应滤波器全部系数的更新。同时,通过控制归一化步长的上下限保证较好的收敛速度和稳态误差。该方法可以实现助听器回波抵消功能,降低算法的计算复杂度的同时保证了算法性能的可控性,能够满足助听器实时性准确性的要求。
-
公开(公告)号:CN104703108A
公开(公告)日:2015-06-10
申请号:CN201510066821.X
申请日:2015-02-06
Applicant: 哈尔滨工业大学深圳研究生院
IPC: H04R25/00
Abstract: 本发明提出了一种本发明是在噪声环境中为数字助听器的宽动态压缩算法,包括以下步骤:步骤A:根据语音增强算法,输出去噪之后的语音信号;步骤B:语音信号输出反馈路径的估算:边界检查计算、根据自适应宽动态压缩3条规则的计算输出;步骤C:把步骤A和步骤B的输出作为宽动态压缩模块的输入,进行语音信号压缩放大,并提高信噪比。传统的压缩算法当外界声源的声压级大小小于正常人的听阈时,助听器一般不启动压缩算法,而让输出声压级大小为0,这样就丢失了音频信号一部分的信息。本发明将对这个过程改进和优化,保留之前输入声压级小于正常人听阈的那部分声音信号的信息,同时本发明还带有噪声消除功能。
-
公开(公告)号:CN104064196A
公开(公告)日:2014-09-24
申请号:CN201410281240.3
申请日:2014-06-20
Applicant: 哈尔滨工业大学深圳研究生院
IPC: G10L21/0308 , G10L25/84
Abstract: 本发明为大规模孤立词语音识别提供了一种基于语音前端处理消除噪声从而提高识别准确率的方法,本发明的方法解决了由于含有噪声在MFCC提取过程中语音端点检测错误导致识别准确率低的问题。计算听觉场景分析(CASA)用于语音识别的前端,相比于降噪、语音增强等传统去噪方法,通过模拟人耳的听觉神经系统,可以有效的将噪声从带噪语音中分离出来。本发明中对10240个带噪语音进行识别,相比于不进行前端噪声处理,识别的准确率由83%提高到了95.5%。
-
公开(公告)号:CN115529084A
公开(公告)日:2022-12-27
申请号:CN202211269713.9
申请日:2022-10-18
Applicant: 鹏城实验室 , 哈尔滨工业大学(深圳)
Abstract: 本发明公开了一种基于相干体制的相位跟踪装置及方法,所述装置包括:反射模块、混频模块、探测模块和控制模块;反射模块用于接收第一光束后传输至混频模块;混频模块用于产生第二光束后,将第二光束与第一光束进行混频,并将得到的第三光束传输至探测模块;探测模块用于将第三光束一分为二,将两部分第三光束的强度信息分别转换为电流信息,并将所有电流信息传输至控制模块;控制模块用于对电流信息进行解算,并将得到的角度补偿信息传输至反射模块,反射模块根据角度补偿信息进行调整。通过将两部分第三光束分别转换为电流信息,并对电流信息进行解算得到角度补偿信息,以便根据角度补偿信息进行调整,提高了激光通信跟踪系统的精度和隔离度。
-
公开(公告)号:CN104703108B
公开(公告)日:2018-04-03
申请号:CN201510066821.X
申请日:2015-02-06
Applicant: 哈尔滨工业大学深圳研究生院
IPC: H04R25/00
Abstract: 本发明提出了一种本发明是在噪声环境中为数字助听器的宽动态压缩算法,包括以下步骤:步骤A:根据语音增强算法,输出去噪之后的语音信号;步骤B:语音信号输出反馈路径的估算:边界检查计算、根据自适应宽动态压缩3条规则的计算输出;步骤C:把步骤A和步骤B的输出作为宽动态压缩模块的输入,进行语音信号压缩放大,并提高信噪比。传统的压缩算法当外界声源的声压级大小小于正常人的听阈时,助听器一般不启动压缩算法,而让输出声压级大小为0,这样就丢失了音频信号一部分的信息。本发明将对这个过程改进和优化,保留之前输入声压级小于正常人听阈的那部分声音信号的信息,同时本发明还带有噪声消除功能。
-
公开(公告)号:CN104064196B
公开(公告)日:2017-08-01
申请号:CN201410281240.3
申请日:2014-06-20
Applicant: 哈尔滨工业大学深圳研究生院
IPC: G10L21/0308 , G10L25/84
Abstract: 本发明为大规模孤立词语音识别提供了一种基于语音前端处理消除噪声从而提高识别准确率的方法,本发明的方法解决了由于含有噪声在MFCC提取过程中语音端点检测错误导致识别准确率低的问题。计算听觉场景分析(CASA)用于语音识别的前端,相比于降噪、语音增强等传统去噪方法,通过模拟人耳的听觉神经系统,可以有效的将噪声从带噪语音中分离出来。本发明中对10240个带噪语音进行识别,相比于不进行前端噪声处理,识别的准确率由83%提高到了95.5%。
-
公开(公告)号:CN104064197B
公开(公告)日:2017-05-17
申请号:CN201410281239.0
申请日:2014-06-20
Applicant: 哈尔滨工业大学深圳研究生院
Abstract: 本发明为大规模孤立词语音识别提供了一种提高识别鲁棒性的方法。本发明的方法引入了不同语音帧之间的相关性,为语音识别的特征参数加入了动态特征。同时通过CASA方法将噪声环境下的语音进行了噪声消除,扩大了语音识别应用领域的范围。本发明待识别孤立词为10240词,实验结果表明,在将语音帧间信息作为动态参数加入到语音特征参数后,平均每个词汇的第一识别概率和第二识别概率的差值增大了30%。
-
公开(公告)号:CN104064181B
公开(公告)日:2017-04-19
申请号:CN201410281283.1
申请日:2014-06-20
Applicant: 哈尔滨工业大学深圳研究生院
IPC: G10L15/06 , G10L15/14 , G10L19/038
Abstract: 本发明为大规模孤立词语音识别的特征向量量化提供了一种快速收敛的方法,能比较快的建立码本。本发明的方法解决了一般特征向量由于词汇量大而导致码本建立过程慢的缺点,实验结果表明,相比较于模拟退火算法,该发明的码本建立过程中运算的迭代次数减小了一个10的量级,同时消除了除法运算和大量的乘法运算。
-
公开(公告)号:CN105139372A
公开(公告)日:2015-12-09
申请号:CN201510066698.1
申请日:2015-02-06
Applicant: 哈尔滨工业大学深圳研究生院
Abstract: 本发明提出了一种在像素运动统计中用于确定像素类型的码本改进算法,优化了传统码本的需要图像M帧建立背景模型的不足,利用图像第一帧,以像素点领域内的信息作为码本的统计码元。不仅在建模阶段利用像素的时空域信息,在寻找匹配码元,进行背景更新时,也充分利用领域内的码本,并引入随机更新背景的概念,优越于传统的背景更新,与传统码本相比,本发明提出的用于前景检测的码本改进算法改善前景检测的正确率,并提高了建模阶段的效率。
-
-
-
-
-
-
-
-
-