语音增强方法、装置、电子设备与存储介质

    公开(公告)号:CN114550738A

    公开(公告)日:2022-05-27

    申请号:CN202210267824.X

    申请日:2022-03-17

    Abstract: 本发明提供一种语音增强方法、装置、电子设备与存储介质,其中方法包括:确定待处理语音的低频数据和高频数据;基于语音增强模型,分别对低频数据和高频数据进行语音增强,得到待处理语音对应的增强语音,增强语音包括低频成分和高频成分,低频成分是对低频数据进行语音增强得到的,高频成分是对高频数据进行语音增强得到的;语音增强模型中,对低频数据进行语音增强的处理精度高于对高频数据进行语音增强的处理精度;语音增强模型基于样本语音的样本低频数据和样本高频数据,以及样本语音对应的纯净语音训练得到。本发明提供的方法、装置、电子设备与存储介质,不仅能够获得良好的语音增强效果,同时也可以降低资源功耗,提升设备续航。

    干扰抑制方法、装置、电子设备和可读存储介质

    公开(公告)号:CN111929707A

    公开(公告)日:2020-11-13

    申请号:CN202010767594.4

    申请日:2020-08-03

    Abstract: 本发明实施例提供一种干扰抑制方法、装置、电子设备和可读存储介质,其中方法包括:根据接收的卫星信号,确定主通道输出信号以及主通道权矢量;将所述主通道输出信号和所述主通道权矢量输入至掩码确定模型,得到所述掩码确定模型输出的掩码;根据所述主通道输出信号和所述掩码,确定干扰抑制信号。本发明实施例提供的干扰抑制方法、装置、电子设备和可读存储介质,对所接收到的GNSS卫星信号通过主通道进行初步干扰抑制,并基于掩码确定模型计算出的掩码进行混合干扰抑制,可以有效地对GNSS卫星信号中的压制式干扰和欺骗式干扰进行抑制。

    语音分离方法、装置、系统、设备、存储介质和程序产品

    公开(公告)号:CN119626248A

    公开(公告)日:2025-03-14

    申请号:CN202411651909.3

    申请日:2024-11-19

    Abstract: 本发明提供一种语音分离方法、装置、系统、设备、存储介质和程序产品,其中方法包括:获取目标车辆上的语音信号,语音信号通过目标车辆上装载的麦克风阵列采集得到;提取语音信号的语音特征和方向性特征,语音特征以及方向性特征均与麦克风阵列的阵型无关;基于语音特征和方向性特征进行语音分离,得到语音信号对应的语音分离结果,能够在不依赖于麦克风阵列的阵型信息的情况下,实现车辆上声音的完全隔离,为各音区的独立交互提供保障,避免了传统方案中车辆上语音分离依赖于通过阵型信息训练得到的分离模型,导致陷入“一车一定制”困境的问题,基于阵型无关的特征进行语音分离,极大地提高了系统大规模交付效率,降低了成本,减少了资源浪费。

    语音降噪方法、装置、电子设备及存储介质

    公开(公告)号:CN117912481A

    公开(公告)日:2024-04-19

    申请号:CN202311550330.3

    申请日:2023-11-16

    Abstract: 本申请提出一种语音降噪方法、装置、电子设备及存储介质,该方法获取待降噪语音对应的语音特征,语音特征包括波形特征和语谱图特征;利用预先确定的语音降噪参数,对语音特征进行降噪处理,得到降噪语音信号;其中,语音降噪参数,是利用预先采集的样本噪声语音的样本语音特征,进行降噪处理训练而确定的,样本语音特征包括样本噪声语音的波形特征和语谱图特征。采用本申请的技术方案,利用样本噪声语音的波形特征和语谱图特征对语音降噪参数进行训练,实现了在语音的时域和频域上结合降噪训练,提高了语音降噪参数的降噪准确度,从而提高了利用语音降噪参数进行降噪处理时,语音的降噪效果。

    多模态语音分离方法、训练方法及相关装置

    公开(公告)号:CN115620723A

    公开(公告)日:2023-01-17

    申请号:CN202211134337.2

    申请日:2022-09-15

    Abstract: 本申请公开了一种多模态语音分离方法、训练方法及相关装置,该方法包括:获得包含目标对象的音视频数据;其中,所述音视频数据包含所述目标对象的唇部视频数据;将所述音视频数据输入至训练后的多模态语音分离网络中,获得与所述目标对象的唇部视频数据相关的音频数据;其中,训练所述多模态语音分离网络的多个训练样本基于其经过所述多模态语音分离网络后获得的第一损失被划分为多个子集,且基于至少部分所述子集对所述多模态语音分离网络再次进行训练。通过上述方式,本申请能够提高多模态语音分离的准确性。

    设备的语音处理方法、装置以及设备

    公开(公告)号:CN113838473A

    公开(公告)日:2021-12-24

    申请号:CN202111131704.9

    申请日:2021-09-26

    Abstract: 本发明公开了一种设备的语音处理方法、装置以及设备,语音处理方法包括:采集设备的语音数据;依据回声消除指令更新回声标记位;依据回声标记位对语音数据进行降噪处理,获得降噪后的语音数据;输出降噪后的语音数据。在降噪模块的输入端增加回声标志位,在需要时才进行回声降噪,不需要时仅仅对环境噪音等其他噪音进行降噪处理,降低了神经网络的学习难度和运算量,同时确保设备提供的通话质量满足用户需求。

    主动降噪方法、系统及汽车

    公开(公告)号:CN107093429A

    公开(公告)日:2017-08-25

    申请号:CN201710316188.4

    申请日:2017-05-08

    Abstract: 本发明公开了一种主动降噪方法及系统,该方法包括:设置用于同步接收声音信号的多个麦克风、以及用于产生反向信号的扬声器,所述多个麦克风包括参考麦克风、光学麦克风和误差麦克风;分别确定参考麦克风与光学麦克风、误差麦克风与光学麦克风之间的声音信号传递关系;利用声音信号传递关系得到参考噪声信号和实际噪声信号,确定参考麦克风的噪声滤波系数矩阵;根据所述噪声滤波系数矩阵控制扬声器产生与所述参考噪声信号幅度相同、方向相反的反向信号,对误差麦克风采集的信号进行降噪。本发明还提供一种具有上述主动降噪系统的汽车,可以消除车内噪声对用户交互的影响,提高用户交互体验。

    发声位置确定方法、装置及声乐练习系统

    公开(公告)号:CN119811173A

    公开(公告)日:2025-04-11

    申请号:CN202411754099.4

    申请日:2024-12-02

    Abstract: 本发明提供一种发声位置确定方法、装置及声乐练习系统,所述方法包括:获取发声人员的语音信号以及生理信号;对语音信号进行声源定位,确定第一发声位置;基于发声位置确定模型,应用语音信号以及生理信号,确定第二发声位置;基于第一发声位置以及第二发声位置,确定发声人员的发声位置。本发明提供的发声位置确定方法、装置及声乐练习系统,通过对语音信号进行声源定位,可以准确对少数特殊发声位置进行检测,同时发声位置确定模型可以准确基于语音可以准确对新发声人员进行发声位置检测,从而结合第一发声位置和第二发声位置可以进一步准确得到发声人员的发声位置。

    一种声源定位方法及装置
    19.
    发明授权

    公开(公告)号:CN106483502B

    公开(公告)日:2019-10-18

    申请号:CN201610848492.9

    申请日:2016-09-23

    Abstract: 本发明实施例提供了一种声源定位方法及装置,其中方法包括:监听不同方向的语音信号,其中来自目标声源方向的语音信号中包含有第一语音;通过对所述不同方向的语音信号进行语音分离得到两路语音信号;对所述两路语音信号分别进行声源追踪,以确定所述两路语音信号各自的声源方向;将所述两路语音信号形成两个波束,并根据所述两路语音信号的声源方向抑制非声源方向的干扰;通过在两个波束中对所述第一语音的识别区分出目标声源和干扰声源。本发明将语音分离和语音识别相结合,在多声源场景下可以很好地对目标声源进行定位,解决了存在干扰情况时目标声源无法定位的技术问题,进而提升了用户的满意度。

    噪声估计方法及系统
    20.
    发明公开

    公开(公告)号:CN109741760A

    公开(公告)日:2019-05-10

    申请号:CN201811554601.1

    申请日:2018-12-18

    Abstract: 本发明公开了一种噪声估计方法及系统,其中所述方法包括:接收带噪语音数据;提取所述带噪语音数据中的原噪声信号;根据频率划分标准,对所述原噪声信号进行压缩,得到目标噪声信号。本发明基于有限的硬件资源,能够在有效减小后续运算量的同时不会造成性能损失。进一步地,本发明可以基于经由大量数据训练的分类器,能够得到准确的噪声数据,为后续降低运算量的相关操作提供可靠的噪声预测基础。更进一步地,本发明可以根据场景噪声特性的先验知识以及准确提取的噪声信号,还能够有效地追踪到不稳定的突变噪声。

Patent Agency Ranking