一种基于融合空间特征的多通道语音增强方法

    公开(公告)号:CN119446166A

    公开(公告)日:2025-02-14

    申请号:CN202411674055.0

    申请日:2024-11-21

    Abstract: 本发明公开了一种基于融合空间特征的多通道语音增强方法,首先从带噪多通道语音中分别提取多通道复频谱特征和融合空间特征,再将提取的多通道复频谱特征和融合空间特征输入深度神经网络进行处理并设定处理目标为理想复值比率掩蔽,再构建基于复卷积编码器解码器结构的深度复卷积循环语音增强网络,再利用深度复卷积循环语音增强网络对多通道复频谱特征和融合空间特征进行处理,输出预测复值比率掩蔽。本发明充分整合光谱信息、方向特征、通道间特征和相关系数特征,并对动态声源进行空间建模,使得网络对于语音信号的理解和处理能力远超传统方法,能够有效应对复杂多变的语音场景,有效地提升静态场景和动态场景下的语音增强效果。

    基于异构多尺度卷积循环网络的回声消除方法及系统

    公开(公告)号:CN119517061A

    公开(公告)日:2025-02-25

    申请号:CN202411576166.8

    申请日:2024-11-06

    Abstract: 本发明公开了基于异构多尺度卷积循环网络的回声消除方法及系统,首先基于多帧上下文提取相关特征模式构建相关编码器,再根据单帧提取频谱模式构建频谱编码器,接着采用相关编码器和频谱编码器组成异构多尺度编码器并获得多路编码特征;本发明实现了具有利用异构双路编码器从输入混合信号频谱和参考信号频谱中提取不同特征的功能,且为适应参考信号和混合信号之间的时延情况而采用相关性编码并从多帧频谱中提取相关性特征表达,同时为了加强当前帧的频谱分辨率而采用频谱编码从当前帧中提取频谱模式表达,还实现了对于双路特征具有进一步采用通道注意力特征软选择机制融合相关性特征编码和频谱编码的功能,适合被广泛推广和使用。

Patent Agency Ranking