-
公开(公告)号:CN119943087A
公开(公告)日:2025-05-06
申请号:CN202411981356.8
申请日:2024-12-30
Applicant: 中电信人工智能科技(北京)有限公司
IPC: G10L21/028 , G10L21/0216
Abstract: 本申请提供一种基于掩蔽波束形成的目标语音提取方法及装置,方法包括:麦克风阵列拾音,通过麦克风阵列采集多通道观测信号;一阶段,基于说话人编码器和语音编码器获取目标语音的特征向量和观测信号的编码特征,通过特征融合和掩膜估计器获取目标语音源和非目标语音源的掩膜,通过掩蔽处理及解码映射获得时域分离语音,通过基于掩蔽的最小方差无失真响应波束形成实现声源的再分离,得到时域语音;二阶段,以一阶段的时域语音作为目标语音分离网络的辅助输入,构建新的融合特征,并重复一阶段处理步骤,直至完成目标语音提取。本申请可有效降低目标源提取中的幅度及相位失真,有效解决同向语音源场景下MVDR波束形成器无法有效消除竞争语音源的难点。
-
公开(公告)号:CN119943085A
公开(公告)日:2025-05-06
申请号:CN202411981375.0
申请日:2024-12-30
Applicant: 中电信人工智能科技(北京)有限公司
IPC: G10L21/0272 , G10L21/0216
Abstract: 本公开提供一种基于指向性卷积波束形成的语音增强与分离方法、装置,方法包括:先根据麦克风阵列,通过多通道观测信号构建历史观测信号矩阵,根据历史观测信号矩阵构建卡尔曼增益线性预测误差模型;再构建基于指向性波束形成器和最大零陷波束形成器的最小方差无失真响应波束形成模型,并估计语音及噪声协方差矩阵;利用基于分离的语音源估计的时变方差,联立卡尔曼增益线性预测误差模型、最小方差无失真响应波束形成模型,建立指向性卷积波束形成模型,通过交替迭代方式完成对语音信号进行增强与分离。本公开在含噪含混响环境下更好地抑制早期混响并降低晚期混响残留;通过构建指向性增益并实时估计噪声协方差矩阵,实现了更鲁棒的语音分离性能。
-
公开(公告)号:CN119920252A
公开(公告)日:2025-05-02
申请号:CN202510092190.2
申请日:2025-01-21
Applicant: 赛力斯汽车有限公司
IPC: G10L15/22 , G10L15/08 , G10L21/0216
Abstract: 本申请涉及智能座舱技术领域,公开了一种车辆语音指令响应方法、装置、设备及存储介质,该方法包括:通过基于车辆的当前运行状态,确定布设在所述车辆上的分布式麦克风阵列的当前工作模式;其中,所述分布式麦克风阵列包括:设置在所述车辆的各个车门外侧的第一麦克风以及设置在所述车辆内部的各预设区域的第二麦克风;根据所述当前工作模式,判定是否控制所述车辆响应所述分布式麦克风阵列所采集到的语音指令。应用本申请的技术方案,能够在车辆的不同运行状态下实现对车内外声源的准确识别,从而判定是否响应语音指令,提升了车辆语音指令响应的准确性与安全性。
-
公开(公告)号:CN115527549B
公开(公告)日:2025-05-02
申请号:CN202211220177.3
申请日:2022-09-30
Applicant: 北京声加科技有限公司
IPC: G10L21/0208 , G10L21/0216 , G10L21/0232 , H04M9/08
Abstract: 本申请提供一种基于音响特殊结构的回声残留抑制方法,包括:利用传声器阵列获取多通道语音时域信号,并转换为多通道频域信号;对多通道频域信号进行优化的回声抵消后得到有回声信号残留的多通道数据,并进行波束空间扫描;根据波束空间扫描的定位结果构造基于空间特性的回声信号残留概率函数;利用基于回声信号残留概率函数优化的回声残留抑制算法,对有回声信号残留的多通道数据进行回声残留抑制得到目标信号。本申请可以有效的区分残留回声和近端语音信号,在近端语音较弱的情况下,有效的检测弱语音信号,从而提高后继单通道语音增强及自动增益控制处理的性能,实现在大回声残留时进一步抑制回声,有近端语音时有效保留近端语音的功能。
-
公开(公告)号:CN119906808A
公开(公告)日:2025-04-29
申请号:CN202411884438.0
申请日:2024-12-19
Applicant: 海信视像科技股份有限公司
Inventor: 于彬
IPC: H04N9/31 , G10L21/0232 , G10L21/0272 , G10L19/02 , G10L25/18 , G10L25/24 , G10L25/48 , G10L21/0216
Abstract: 本申请涉及一种投影设备及其音频降噪方法,涉及音频处理领域。该投影设备中包括风扇,被配置为投影设备进行降温;麦克风阵列,包括至少两个麦克风,被配置为采集音频数据;控制器,与麦克风阵列连接,被配置为:控制第一麦克风采集第一音频数据,以及第二麦克风同步采集第二音频数据;其中,第一麦克风为麦克风阵列中靠近标准语音发起位置的麦克风;第二麦克风为麦克风阵列中靠近风扇设置的麦克风;根据第二音频数据,对第一音频数据进行降噪处理,得到目标音频数据。采用上述技术方案提高了目标音频数据的清晰度,并提高了降噪效率,另外,由于无需额外引入其他硬件设备,还减少了硬件成本投入。
-
公开(公告)号:CN119905099A
公开(公告)日:2025-04-29
申请号:CN202311412215.X
申请日:2023-10-27
Applicant: 北京小米移动软件有限公司 , 北京小米松果电子有限公司
IPC: G10L21/0208 , G10L21/0216 , G10L21/0232 , H04M1/19
Abstract: 本公开是关于一种声音信号处理方法、装置及存储介质。声音信号处理方法,包括:获取原始声音信号,并对原始声音信号进行风噪检测,得到频率分界值;基于频率分界值确定第一信号和第二信号,其中,第一信号用于表示被风噪干扰的声音信号,第一信号的频率值小于频率分界值,第二信号用于表示未被风噪干扰的声音信号,第二信号的频率值大于或等于频率分界值;对第二信号进行频带拓展,得到第一全频带信号,第一全频带信号为与第二信号对应的全频带信号;基于第一全频带信号,重构第一信号;基于重构的第一信号以及第二信号,得到目标声音信号。通过本公开,将被风噪干扰的声音信号进行频带拓展,得到重构的声音信号。
-
公开(公告)号:CN119905088A
公开(公告)日:2025-04-29
申请号:CN202510077335.1
申请日:2025-01-17
Applicant: 南京酷开智慧屏科技有限公司
Inventor: 方伟
IPC: G10L15/08 , G10L15/32 , G10L21/0216
Abstract: 本发明公开了一种应用的远场语音唤醒方法、系统、终端及存储介质,所述方法包括:当检测到用户发出应用唤醒指令时,根据所述应用唤醒指令获取目标设备采集的录音数据,并对所述录音数据进行增强降噪处理,得到目标录音数据;对所述目标设备进行类型确认,得到设备类型信息,并根据所述设备类型信息进行架构决策评估,得到目标唤醒架构;根据所述目标唤醒架构对所述目标录音数据进行数据处理,得到应用唤醒信号,并根据所述应用唤醒信号唤醒对应的语音应用。本发明通过引入决策模块能够快速评估出最佳的唤醒支持结构,并通过定制统一的通用接口,实现了唤醒算法模块的复用。
-
公开(公告)号:CN114067824B
公开(公告)日:2025-04-29
申请号:CN202111316293.0
申请日:2021-11-08
Applicant: 西安交通大学
IPC: G10L21/0208 , G10L21/0264 , G10L21/0216 , G10L25/30 , H04L25/02
Abstract: 本发明公开了一种融合超声波信号特征的语音增强方法及系统,先预定义超声信号,再使用设备自带的扬声器和麦克风主动发射和接收超声信号,进行信道估计得到信道冲击响应作为反映用户说话时面部发声器官的运动特征作为语音的一种补充模态信息输入神经网络中实现语音增强。本发明充分利用了用户发声动作特征辅助语音增强任务,提高了语音增强效果,具有广泛的应用前景。
-
公开(公告)号:CN119889258A
公开(公告)日:2025-04-25
申请号:CN202411999871.9
申请日:2024-12-31
Applicant: 小米汽车科技有限公司
Inventor: 宋其岩
IPC: G10H1/36 , G10L21/0216
Abstract: 本申请提出一种音频处理方法、装置、电子设备、车辆和存储介质,涉及语音处理领域,其中,方法包括:通过电子设备的扬声器阵列播放原始音频信号;通过电子设备的麦克风阵列,拾取电子设备所处环境内的环境音频信号;对环境音频信号进行声源方向估计,得到至少一个目标声源方向;基于各目标声源方向,对环境音频信号进行语音增强,得到各目标声源方向上的增强音频信号;基于各增强音频信号和原始音频信号,生成目标音频信号。由此,可以实现复用电子设备内置的麦克风阵列来实现Karaoke的娱乐功能,由于内置的麦克风阵列通常具有更低的延迟,可以提供更加流畅和自然的听感体验。
-
公开(公告)号:CN114339539B
公开(公告)日:2025-04-25
申请号:CN202111411208.9
申请日:2021-11-25
Applicant: 清华大学苏州汽车研究院(相城)
IPC: H04R1/40 , G10L21/02 , G10L21/0208 , G10L25/03 , G10L21/0216
Abstract: 本发明公开了一种采用麦克风阵列拾音的多通道语音增强方法,该方法包括利用多个单通道麦克风对语音进行多通道拾音并进行预处理;基于参考麦克风的选择,采用NCC和MCS两种特征提取并联合平均的方式降低通道间的信号差异,设计出与参考麦克风对应的滤波器;对其它单通道麦克风进行NCC和MCS两种特征提取,并设计出与其它单通道参考麦克风一一对应的滤波器;将所有的单通道麦克风的增强语音信号进行联合并将进行均值处理,以获得最终的增强语音信号。本发明提供的多通道语音增强方法采用NCC和MCS两种特征提取并联合平均的方式降低通道间的信号差异,对室内空间中远近场带噪语音起到很好的降噪效果。
-
-
-
-
-
-
-
-
-