-
公开(公告)号:CN105403860B
公开(公告)日:2017-10-31
申请号:CN201410451825.5
申请日:2014-08-19
Applicant: 中国科学院声学研究所
IPC: G01S5/20
Abstract: 本发明涉及一种基于支配相关的多稀疏声源定位方法,包括:将通过麦克风阵列接收的声源信号转化成数字声音信号;提取每个麦克风的数字声音信号的频谱;利用相邻时间相同频点上所有麦克风的数字声音信号的频谱计算每个频点上的空间相关矩阵;提取空间相关矩阵的主特征向量;确定每个频点上所有麦克风对的时间延迟集合;采用迭代的方法,计算每个频点上处于支配地位的声源入射方向的方位角;对所有频点上的处于支配地位声源入射方向的方位角进行统计分析,确定最终的声源入射方向和声源个数。该方法考虑了声学鲁棒性,适用于多稀疏声源的实时定位。
-
公开(公告)号:CN106405501B
公开(公告)日:2019-05-17
申请号:CN201510456996.1
申请日:2015-07-29
Applicant: 中国科学院声学研究所
IPC: G01S5/22
Abstract: 本发明涉及一种基于相位差回归的单声源定位方法,包括:将通过麦克风阵列接收的声源信号转换成数字声音信号;对所述数字声音信号进行预处理,然后提取麦克风阵列中每个麦克风的数字声音信号的频谱;利用相邻时间相同频点上所有麦克风的数字声音信号的频谱计算t时刻每个频点的空间相关矩阵;对t时刻每个频点上的空间相关矩阵进行分解,得到t时刻每个频点上的主特征向量;利用t时刻每个频点上的主特征向量求取t时刻每个频点上M对麦克风的相位差集合;采用迭代的方法,对相位差进行回归得到t时刻声源的入射方向角。
-
公开(公告)号:CN108113646A
公开(公告)日:2018-06-05
申请号:CN201611063316.0
申请日:2016-11-28
Applicant: 中国科学院声学研究所
IPC: A61B5/00
CPC classification number: A61B5/7203 , A61B5/7225
Abstract: 本发明公开了一种心音信号周期的检测与心音的状态分割方法,该方法包括下列步骤:步骤1)对于一段时长的心音信号,加窗截取若干段长度为L的信号;对任一段信号Y,进行自相关分析,得到心音信号的一个心动周期长度N;据此进行整周期的心音信号切分,得到k段信号;步骤2)对k段整周期心音信号进行主成分分析,得到经典心音周期信号x;步骤3)对经典心音周期信号x进行分帧处理,提取能量包络,采取极大似然估计算法建立二元隐马尔可夫模型,得到各帧所属状态,并据此得到4个状态的分割点。本发明的方法能够准确划分心音信号的状态,增强心音分析应用系统对噪声环境的适应性。
-
公开(公告)号:CN105403860A
公开(公告)日:2016-03-16
申请号:CN201410451825.5
申请日:2014-08-19
Applicant: 中国科学院声学研究所
IPC: G01S5/20
Abstract: 本发明涉及一种基于支配相关的多稀疏声源定位方法,包括:将通过麦克风阵列接收的声源信号转化成数字声音信号;提取每个麦克风的数字声音信号的频谱;利用相邻时间相同频点上所有麦克风的数字声音信号的频谱计算每个频点上的空间相关矩阵;提取空间相关矩阵的主特征向量;确定每个频点上所有麦克风对的时间延迟集合;采用迭代的方法,计算每个频点上处于支配地位的声源入射方向的方位角;对所有频点上的处于支配地位声源入射方向的方位角进行统计分析,确定最终的声源入射方向和声源个数。该方法考虑了声学鲁棒性,适用于多稀疏声源的实时定位。
-
公开(公告)号:CN108398664A
公开(公告)日:2018-08-14
申请号:CN201710068121.3
申请日:2017-02-07
Applicant: 中国科学院声学研究所
IPC: G01S5/18
Abstract: 本发明涉及一种用于麦克风阵列的解析式空间解混叠方法,包括:麦克风阵列接收声源信号,所述声源信号转换成数字声音信号;提取所述数字声音信号的频谱,得到麦克风阵列中每个麦克风的数字声音信号的频谱;根据每个麦克风的数字声音信号的频谱,估计每一个频点上的空间相关矩阵;对每一个频点上的空间相关矩阵进行分解,得到主特征向量,所述主特征向量的每个分量对应一个麦克风的采集信号;根据每个频点上的主特征向量,求取任意两个麦克风间的时间相位差;根据麦克风之间的时间相位差,通过解混叠公式求取周期数组合,进而从中找出最优的周期值。
-
公开(公告)号:CN106405501A
公开(公告)日:2017-02-15
申请号:CN201510456996.1
申请日:2015-07-29
Applicant: 中国科学院声学研究所
IPC: G01S5/22
CPC classification number: G01S5/22
Abstract: 本发明涉及一种基于相位差回归的单声源定位方法,包括:将通过麦克风阵列接收的声源信号转换成数字声音信号;对所述数字声音信号进行预处理,然后提取麦克风阵列中每个麦克风的数字声音信号的频谱;利用相邻时间相同频点上所有麦克风的数字声音信号的频谱计算t时刻每个频点的空间相关矩阵;对t时刻每个频点上的空间相关矩阵进行分解,得到t时刻每个频点上的主特征向量;利用t时刻每个频点上的主特征向量求取t时刻每个频点上M对麦克风的相位差集合;采用迭代的方法,对相位差进行回归得到t时刻声源的入射方向角。
-
公开(公告)号:CN103837858A
公开(公告)日:2014-06-04
申请号:CN201210483581.X
申请日:2012-11-23
Applicant: 中国科学院声学研究所 , 北京中科信利技术有限公司
IPC: G01S5/20
CPC classification number: G01S5/20 , G01S3/8083
Abstract: 本发明涉及一种用于平面阵列的远场波达角估计方法及系统,所述的方法包含:步骤101)将平面阵列作为麦克风对组成的线性子阵列的几何组合,且每一个线性子阵列决定一个子波达角;步骤102)在假定波达方向x已知的情况下:采用全局波达角来计算各子阵列的期望子波达角θi;通过各子阵列的时间差计算子阵列的估计子波达角步骤103)基于估计子波达角和期望子波达角构造代价函数为:步骤104)将代价函数收敛时的波达角作为最终确定的波达角的值,完成声源定位。所述τi采用如下策略获得:提取麦克风阵列的输出数字信号,对每一帧的数字化声音信号做加窗预处理,傅立叶变换并且在频域白化信号;计算预处理后信号的交叉相关,求取所有麦克风对之间的时间延迟τi。
-
公开(公告)号:CN101853661A
公开(公告)日:2010-10-06
申请号:CN201010178166.4
申请日:2010-05-14
Applicant: 中国科学院声学研究所
Abstract: 本发明涉及一种基于非监督学习的噪声功率谱估计与语音活动度检测方法,包括下列步骤:1)对于语音信号在每一个频点上的对数幅度特征,建立一个GMM模型;2)对于一段语音数据,设定M帧缓存,把前M帧输入信号存入缓存中,提取缓存中M帧的对数幅度谱,代入步骤1)的GMM模型进行初始化,得到初始化的模型λ0,k;3)在得到初始化的模型λ0,k之后,从第M+1帧开始,采用增量学习的方法,逐帧更新GMM模型,依次递推得到并得出噪声值和语音信号在第i帧的第k个频点上的出现概率。本发明是谱估计与语音活动度检测的紧耦合解决方案,能够增强语音应用系统对噪声环境的适应性;本发明不依赖于“噪声起始”假设,并且,本发明还能够提供语音活动度在时频二维空间上的描述。
-
公开(公告)号:CN108269583A
公开(公告)日:2018-07-10
申请号:CN201710001937.4
申请日:2017-01-03
Applicant: 中国科学院声学研究所
IPC: G10L21/0272 , G10L21/0308 , G10L25/03
Abstract: 本发明涉及一种基于时间延迟直方图的语音分离方法,包括:将声源信号转换成数字声音信号;提取数字声音信号的频谱;利用声源信号中所有时频点上的时间延迟来构建时间延迟直方图,抽取显著峰值作为时间延迟的估计值;利用时间延迟的估计值来计算每个语音源的波达方向估计值;利用每个语音源的波达方向估计值对混合语音的频谱进行分类,得到每个语音源的掩摸,进而根据该掩摸以及数字声音信号的频谱计算频域上的分离信号;在每个掩摸上对频域的分离信号进行傅里叶逆变换,得到分离的语音。
-
10.
公开(公告)号:CN103837858B
公开(公告)日:2016-12-21
申请号:CN201210483581.X
申请日:2012-11-23
Applicant: 中国科学院声学研究所 , 北京中科信利技术有限公司
IPC: G01S5/20
Abstract: 域白化信号;计算预处理后信号的交叉相关,求本发明涉及一种用于平面阵列的远场波达 取所有麦克风对之间的时间延迟τi。角估计方法及系统,所述的方法包含:步骤101)将平面阵列作为麦克风对组成的线性子阵列的几何组合,且每一个线性子阵列决定一个子波达角;步骤102)在假定波达方向x已知的情况下:采用全局波达角来计算各子阵列的期望子波达角θi;通过各子阵列的时间差计算子阵列的估计子波达角 步骤103)基于估计子波达角和期望子波达角构造代价函数为:步骤104)将代价函数收敛时的波达角作为最终确定的波达角的(56)对比文件Futoshi Asano et al.“.SpeechEnhancement Based on the SubspaceMethod”《.IEEE TRANSACTIONS ON SPEECH ANDAUDIO PROCESSING》.2000,第8卷(第5期),497-507.Cha Zhang et al.“.Maximum LikelihoodSound Source Localization and Beamformingfor Directional Microphone Arrays inDistributed Meetings”《.IEEE TRANSACTIONSON MULTIMEDIA》.2008,第10卷(第3期),538-548.
-
-
-
-
-
-
-
-
-