-
公开(公告)号:CN117912481A
公开(公告)日:2024-04-19
申请号:CN202311550330.3
申请日:2023-11-16
Applicant: 科大讯飞股份有限公司
IPC: G10L21/0224 , G10L21/0232 , G10L21/0332 , G10L21/04 , G10L15/06 , G10L15/065 , G10L15/16
Abstract: 本申请提出一种语音降噪方法、装置、电子设备及存储介质,该方法获取待降噪语音对应的语音特征,语音特征包括波形特征和语谱图特征;利用预先确定的语音降噪参数,对语音特征进行降噪处理,得到降噪语音信号;其中,语音降噪参数,是利用预先采集的样本噪声语音的样本语音特征,进行降噪处理训练而确定的,样本语音特征包括样本噪声语音的波形特征和语谱图特征。采用本申请的技术方案,利用样本噪声语音的波形特征和语谱图特征对语音降噪参数进行训练,实现了在语音的时域和频域上结合降噪训练,提高了语音降噪参数的降噪准确度,从而提高了利用语音降噪参数进行降噪处理时,语音的降噪效果。
-
公开(公告)号:CN114339113B
公开(公告)日:2024-12-03
申请号:CN202111456189.1
申请日:2021-12-01
Applicant: 科大讯飞股份有限公司
Inventor: 张子洋
IPC: H04N7/14 , G10L21/0216 , G10L25/51 , G01S5/20 , G06V40/16
Abstract: 本申请公开了一种视频通话方法及相关装置、通话设备和存储介质,其中,视频通话方法包括:对视频通话设备当前时刻下的音频数据进行第一定位,得到当前时刻下说话人的第一方位,并对视频通话设备当前时刻下的待测图像进行第二定位,得到当前时刻下说话人的第二方位;其中,第一定位、第二定位中至少一者在执行过程中参考当前时刻之前若干历史时刻的定位结果,且定位结果包括历史时刻下说话人的第一方位和第二方位;结合第一方位和第二方位,得到当前时刻下说话人的最终方位;基于最终方位,通过视频通话设备进行视频通话。上述方案,能够在视频通话过程中,提升说话人定位精度。
-
公开(公告)号:CN117558286A
公开(公告)日:2024-02-13
申请号:CN202311687258.9
申请日:2023-12-06
Applicant: 科大讯飞股份有限公司
IPC: G10L21/0208 , G10L21/0216 , G10L21/0264
Abstract: 本发明提供一种语音降噪方法、装置、车辆、电子设备和存储介质,所述方法包括:确定目标麦克风采集的待降噪语音信号,以及参考麦克风采集的参考语音信号,目标麦克风与参考麦克风之间的距离大于阈值;基于待降噪语音信号与参考语音信号之间的相关度,确定加权系数;基于加权系数,以及参考语音信号,从待降噪语音信号中提取得到干净语音信号。本发明提供的语音降噪方法、装置、车辆、电子设备和存储介质,由于目标麦克风与参考麦克风之间的距离大于阈值,从而可以保证目标麦克风采集到的待降噪语音信号与参考麦克风采集到的参考语音信号之间存在差异,进而将参考语音信号作为辅助信号,能够更加准确识别和抑制待降噪语音信号中的噪声。
-
公开(公告)号:CN119535357A
公开(公告)日:2025-02-28
申请号:CN202411619589.3
申请日:2024-11-13
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种声源定位方法及相关方法、装置、设备和存储介质,其中,声源定位方法包括:获取包含双麦克风的拾音阵列所采集到的待处理音频;基于声源定位模型处理待处理音频,预测得到目标声源至拾音阵列的相对位置;其中,声源定位模型基于样本音频训练得到,样本音频标注有样本声源所在的实际区域,样本音频至少包括仿真音频,仿真音频由在多个车内区域分别播放音频时样本阵列的采集音频叠加得到,且在声源定位模型训练之前扬声机构依次在各个车内区域播放音频。上述方案,能够在实现多音区的前提下,尽可能地降低硬件成本、运维难度和对车载音频处理系统的性能要求,同时尽可能地减小硬件原因影响多音区分区效果。
-
公开(公告)号:CN111929707B
公开(公告)日:2023-12-01
申请号:CN202010767594.4
申请日:2020-08-03
Applicant: 科大讯飞股份有限公司
Abstract: 本发明实施例提供一种干扰抑制方法、装置、电子设备和可读存储介质,其中方法包括:根据接收的卫星信号,确定主通道输出信号以及主通道权矢量;将所述主通道输出信号和所述主通道权矢量输入至掩码确定模型,得到所述掩码确定模型输出的掩码;根据所述主通道输出信号和所述掩码,确定干扰抑制信号。本发明实施例提供的干扰抑制方法、装置、电子设备和可读存储介质,对所接收到的GNSS卫星信号通过主通道进行初步干扰抑制,并基于掩码确定模型计算出的掩码进行混合干扰抑制,可以有效地对GNSS卫星信号中的压制式干扰和欺骗式干扰进行抑制。
-
公开(公告)号:CN114339113A
公开(公告)日:2022-04-12
申请号:CN202111456189.1
申请日:2021-12-01
Applicant: 科大讯飞股份有限公司
Inventor: 张子洋
IPC: H04N7/14 , G10L21/0216 , G10L25/51 , G01S5/20 , G06V40/16
Abstract: 本申请公开了一种视频通话方法及相关装置、通话设备和存储介质,其中,视频通话方法包括:对视频通话设备当前时刻下的音频数据进行第一定位,得到当前时刻下说话人的第一方位,并对视频通话设备当前时刻下的待测图像进行第二定位,得到当前时刻下说话人的第二方位;其中,第一定位、第二定位中至少一者在执行过程中参考当前时刻之前若干历史时刻的定位结果,且定位结果包括历史时刻下说话人的第一方位和第二方位;结合第一方位和第二方位,得到当前时刻下说话人的最终方位;基于最终方位,通过视频通话设备进行视频通话。上述方案,能够在视频通话过程中,提升说话人定位精度。
-
公开(公告)号:CN111929707A
公开(公告)日:2020-11-13
申请号:CN202010767594.4
申请日:2020-08-03
Applicant: 科大讯飞股份有限公司
Abstract: 本发明实施例提供一种干扰抑制方法、装置、电子设备和可读存储介质,其中方法包括:根据接收的卫星信号,确定主通道输出信号以及主通道权矢量;将所述主通道输出信号和所述主通道权矢量输入至掩码确定模型,得到所述掩码确定模型输出的掩码;根据所述主通道输出信号和所述掩码,确定干扰抑制信号。本发明实施例提供的干扰抑制方法、装置、电子设备和可读存储介质,对所接收到的GNSS卫星信号通过主通道进行初步干扰抑制,并基于掩码确定模型计算出的掩码进行混合干扰抑制,可以有效地对GNSS卫星信号中的压制式干扰和欺骗式干扰进行抑制。
-
-
-
-
-
-