-
公开(公告)号:CN119049496A
公开(公告)日:2024-11-29
申请号:CN202411019333.9
申请日:2024-07-29
Applicant: 中国科学院上海微系统与信息技术研究所
IPC: G10L21/0216
Abstract: 本发明涉及一种逐次变分模态分解的声音增强方法和装置,其中,方法包括:对接收到的声音信号进行逐次变分模态分解,得到若干本征模态函数;引入相关系数和欧几里德距离来确定模态的分界点,将所述若干本征模态函数分为信号主导模式、噪声主导模式和纯噪音模式;保留所述信号主导模式,对所述噪声主导模式进行降噪,丢弃所述纯噪音模式,并基于降噪后的噪声主导模式与所述信号主导模式进行相加重构,得到声音增强信号。本发明能够有效提升声音增强的效果,为后续识别准确率提供基础。
-
公开(公告)号:CN111261189B
公开(公告)日:2023-01-31
申请号:CN202010252702.4
申请日:2020-04-02
Applicant: 中国科学院上海微系统与信息技术研究所
Abstract: 本发明涉及一种车辆声音信号特征提取方法,包括:对车辆声音信号进行预处理,同时提取基频;作快速傅里叶变换,计算出信号能量谱;将声音信号基频与梅尔三角滤波器组的中心频率进行组合,得到基频自适应三角滤波器组;将信号能量谱通过基频自适应三角滤波器组,得到基频自适应梅尔能量谱;对基频自适应的梅尔能量谱进行倒谱分析,得到基频自适应梅尔倒谱系数;对基频自适应梅尔倒谱系数的每一维分量进行加权,得到最终的车辆声音信号特征。本发明降低了同种车型声音信号特征间的区分度,增大了不同车型声音信号特征之间的差别,从而提高声音信号特征的抗噪能力以及在野外环境下的鲁棒性。
-
公开(公告)号:CN111261189A
公开(公告)日:2020-06-09
申请号:CN202010252702.4
申请日:2020-04-02
Applicant: 中国科学院上海微系统与信息技术研究所
Abstract: 本发明涉及一种车辆声音信号特征提取方法,包括:对车辆声音信号进行预处理,同时提取基频;作快速傅里叶变换,计算出信号能量谱;将声音信号基频与梅尔三角滤波器组的中心频率进行组合,得到基频自适应三角滤波器组;将信号能量谱通过基频自适应三角滤波器组,得到基频自适应梅尔能量谱;对基频自适应的梅尔能量谱进行倒谱分析,得到基频自适应梅尔倒谱系数;对基频自适应梅尔倒谱系数的每一维分量进行加权,得到最终的车辆声音信号特征。本发明降低了同种车型声音信号特征间的区分度,增大了不同车型声音信号特征之间的差别,从而提高声音信号特征的抗噪能力以及在野外环境下的鲁棒性。
-
公开(公告)号:CN113487654A
公开(公告)日:2021-10-08
申请号:CN202110768710.9
申请日:2021-07-07
Applicant: 中国科学院上海微系统与信息技术研究所
Abstract: 本发明涉及一种基于多专家决策的多模态视觉目标跟踪方法,包括:步骤(1):分别从当前帧的可见光图像和热红外图像中获取多个尺度的搜索窗口,并根据所述多个尺度的搜索窗口提取可见光图像和热红外图像的外观特征;步骤(2):采用若干判别相关滤波器分别作为专家,将提取的可见光图像和热红外图像的外观特征输入所述若干判别相关滤波器,根据每个专家输出的相关响应得分分别预测当前帧的目标位置;步骤(3):将每个专家预测的当前帧的目标位置乘以每个专家的权重,得到最终目标的位置。本发明能够实现对目标的有效跟踪。
-
-
-