一种基于向量机框架的多通道语音活动检测方法

    公开(公告)号:CN107424625A

    公开(公告)日:2017-12-01

    申请号:CN201710499621.2

    申请日:2017-06-27

    Abstract: 本发明公开了一种基于支持向量机(SVM)框架的多通道语音活动检测方法。针对传统的语音活动检测方法容易引入较大的噪声,并且难以根据环境的变化而自动调整阈值,本发明利用麦克风阵列融合了语音信号的时空信息特点,结合贴近人耳感知特性的梅尔频率倒谱系数(MFCC),使用具有较好分类能力的支持向量机(SVM)来对语音/非语音进行分类,建立了针对语音和非语音的模型,能够准确的进行语音活动检测,有效的解决了在传统的语音活动检测算法的问题。

    一种基于集成学习的室内声源定位方法

    公开(公告)号:CN105976827A

    公开(公告)日:2016-09-28

    申请号:CN201610356146.9

    申请日:2016-05-26

    Abstract: 本发明公开了一种基于集成学习的室内声源定位方法,特别是涉及声源定位识别方法所使用的特征。本发明使用信号的相位变换广义互相关函数作为位置特征,将声源信号数据转换成特征数据集,再使用集成学习技术(Bagging,AdaBoost等)对特征数据进行训练和定位测试,最终得到的集成学习分类器能很好地鉴别声源位置,克服了传统声源定位算法在恶劣环境下性能损失严重的不足。相比较传统的定位算法,本发明的优势在于能在室内环境下,有较强的噪声、混响的恶劣环境下,依旧能够获得鲁棒的声源定位性能。

Patent Agency Ranking