-
公开(公告)号:CN104703108A
公开(公告)日:2015-06-10
申请号:CN201510066821.X
申请日:2015-02-06
Applicant: 哈尔滨工业大学深圳研究生院
IPC: H04R25/00
Abstract: 本发明提出了一种本发明是在噪声环境中为数字助听器的宽动态压缩算法,包括以下步骤:步骤A:根据语音增强算法,输出去噪之后的语音信号;步骤B:语音信号输出反馈路径的估算:边界检查计算、根据自适应宽动态压缩3条规则的计算输出;步骤C:把步骤A和步骤B的输出作为宽动态压缩模块的输入,进行语音信号压缩放大,并提高信噪比。传统的压缩算法当外界声源的声压级大小小于正常人的听阈时,助听器一般不启动压缩算法,而让输出声压级大小为0,这样就丢失了音频信号一部分的信息。本发明将对这个过程改进和优化,保留之前输入声压级小于正常人听阈的那部分声音信号的信息,同时本发明还带有噪声消除功能。
-
公开(公告)号:CN104281837A
公开(公告)日:2015-01-14
申请号:CN201410501116.3
申请日:2014-09-26
Applicant: 哈尔滨工业大学深圳研究生院
IPC: G06K9/00
Abstract: 本发明提出了一种将卡尔曼滤波与相邻帧间扩大感兴趣区域方法相结合进行行人跟踪的方法。本发明提供一种结合卡尔曼滤波和相邻帧间ROI扩大的行人跟踪方法,该方法克服了在遮挡问题上行人跟踪处理效果不理想的问题,非常适合于对行人的实时跟踪。实验结果表明,该方法可以很好地在行人被遮挡时候,利用之前的跟踪位置信息来预测当前行人的位置,提高行人跟踪的准确率。
-
公开(公告)号:CN104064196A
公开(公告)日:2014-09-24
申请号:CN201410281240.3
申请日:2014-06-20
Applicant: 哈尔滨工业大学深圳研究生院
IPC: G10L21/0308 , G10L25/84
Abstract: 本发明为大规模孤立词语音识别提供了一种基于语音前端处理消除噪声从而提高识别准确率的方法,本发明的方法解决了由于含有噪声在MFCC提取过程中语音端点检测错误导致识别准确率低的问题。计算听觉场景分析(CASA)用于语音识别的前端,相比于降噪、语音增强等传统去噪方法,通过模拟人耳的听觉神经系统,可以有效的将噪声从带噪语音中分离出来。本发明中对10240个带噪语音进行识别,相比于不进行前端噪声处理,识别的准确率由83%提高到了95.5%。
-
公开(公告)号:CN101938646A
公开(公告)日:2011-01-05
申请号:CN200910108172.X
申请日:2009-07-03
Applicant: 哈尔滨工业大学深圳研究生院
IPC: H04N7/26
Abstract: 在H.264/AVC视频编码系统中,运动估计是一种重要的减少时间相关信息的技术。运动估计包括整数运动估计部分和小数运动估计部分。其中1/4像素运动估计中需要大量运算。采用FPGA或ASIC方式实现视频编码,可以利用并行体系结构完成此部分运动估计。本发明提出了一种硬件并行实现方法,插值时采用16个滤波结构并行计算,提高了计算效率。
-
公开(公告)号:CN101938644A
公开(公告)日:2011-01-05
申请号:CN200910108169.8
申请日:2009-07-03
Applicant: 哈尔滨工业大学深圳研究生院
Abstract: 在H.264/AVC视频编码系统中,运动估计是一种重要的减少时间相关信息的技术。运动估计包括整数运动估计部分和小数运动估计部分。其中1/2像素运动估计插值及存储部分需要大量运算。采用FPGA或ASIC方式实现视频编码,可以利用并行体系结构完成此部分运动估计。本发明提出了一种硬件并行实现方法,插值时采用九个滤波结构并行计算,并在内部缓存插值中间数据,提高了计算效率。
-
公开(公告)号:CN104281837B
公开(公告)日:2018-05-25
申请号:CN201410501116.3
申请日:2014-09-26
Applicant: 哈尔滨工业大学深圳研究生院
IPC: G06K9/00
Abstract: 本发明提出了一种将卡尔曼滤波与相邻帧间扩大感兴趣区域方法相结合进行行人跟踪的方法。本发明提供一种结合卡尔曼滤波和相邻帧间ROI扩大的行人跟踪方法,该方法克服了在遮挡问题上行人跟踪处理效果不理想的问题,非常适合于对行人的实时跟踪。实验结果表明,该方法可以很好地在行人被遮挡时候,利用之前的跟踪位置信息来预测当前行人的位置,提高行人跟踪的准确率。
-
公开(公告)号:CN104703108B
公开(公告)日:2018-04-03
申请号:CN201510066821.X
申请日:2015-02-06
Applicant: 哈尔滨工业大学深圳研究生院
IPC: H04R25/00
Abstract: 本发明提出了一种本发明是在噪声环境中为数字助听器的宽动态压缩算法,包括以下步骤:步骤A:根据语音增强算法,输出去噪之后的语音信号;步骤B:语音信号输出反馈路径的估算:边界检查计算、根据自适应宽动态压缩3条规则的计算输出;步骤C:把步骤A和步骤B的输出作为宽动态压缩模块的输入,进行语音信号压缩放大,并提高信噪比。传统的压缩算法当外界声源的声压级大小小于正常人的听阈时,助听器一般不启动压缩算法,而让输出声压级大小为0,这样就丢失了音频信号一部分的信息。本发明将对这个过程改进和优化,保留之前输入声压级小于正常人听阈的那部分声音信号的信息,同时本发明还带有噪声消除功能。
-
公开(公告)号:CN104766046B
公开(公告)日:2018-02-16
申请号:CN201510065181.0
申请日:2015-02-06
Applicant: 哈尔滨工业大学深圳研究生院
Abstract: 本发明涉及应用计算机视觉研究领域,尤其涉及一种利用交通标识颜色及形状特征进行检测与识别方法。本发明首先选取适当的颜色空间对原始图像做阈值分割,得到了含有红、蓝、黄颜色信息的交通标识目标图,随后对通过图像分割得到的目标图像进行一定的预处理。图像预处理的主要作用就是去除噪声干扰物及对图像做一定的细节处理以改善图像质量,接下来对经过预处理的图像进行形状识别。形状识别可以进一步区分目标物体与非目标物体,对后续的交通标识的识别起到一个辅助的作用,最后对分割得到的不同种类的交通标识进行识别,支持向量机能避免局部最优值及过度拟合等问题,同时对小样本分类有着良好性能。
-
公开(公告)号:CN104064196B
公开(公告)日:2017-08-01
申请号:CN201410281240.3
申请日:2014-06-20
Applicant: 哈尔滨工业大学深圳研究生院
IPC: G10L21/0308 , G10L25/84
Abstract: 本发明为大规模孤立词语音识别提供了一种基于语音前端处理消除噪声从而提高识别准确率的方法,本发明的方法解决了由于含有噪声在MFCC提取过程中语音端点检测错误导致识别准确率低的问题。计算听觉场景分析(CASA)用于语音识别的前端,相比于降噪、语音增强等传统去噪方法,通过模拟人耳的听觉神经系统,可以有效的将噪声从带噪语音中分离出来。本发明中对10240个带噪语音进行识别,相比于不进行前端噪声处理,识别的准确率由83%提高到了95.5%。
-
公开(公告)号:CN104064197B
公开(公告)日:2017-05-17
申请号:CN201410281239.0
申请日:2014-06-20
Applicant: 哈尔滨工业大学深圳研究生院
Abstract: 本发明为大规模孤立词语音识别提供了一种提高识别鲁棒性的方法。本发明的方法引入了不同语音帧之间的相关性,为语音识别的特征参数加入了动态特征。同时通过CASA方法将噪声环境下的语音进行了噪声消除,扩大了语音识别应用领域的范围。本发明待识别孤立词为10240词,实验结果表明,在将语音帧间信息作为动态参数加入到语音特征参数后,平均每个词汇的第一识别概率和第二识别概率的差值增大了30%。
-
-
-
-
-
-
-
-
-