-
公开(公告)号:CN115798503A
公开(公告)日:2023-03-14
申请号:CN202211185768.1
申请日:2022-09-27
Applicant: 上海富瀚微电子股份有限公司
IPC: G10L21/0232 , H04R1/40
Abstract: 本发明公开了一种定向拾音方法、装置及电子设备,所述方法包括以下步骤:步骤S1,根据目标声源方位角求出麦克风频域信号相位差,并对相位进行补偿;步骤S2,对补偿后的麦克风信号进行求和,得到目标信号的第一增强信号,本发明通过在频域对麦克风相位进行线性补偿,可突破采样率的限制,使目标方向的两个麦克风信号的相位完全一致,有利于提升delay and sum算法效果。
-
公开(公告)号:CN117935817A
公开(公告)日:2024-04-26
申请号:CN202410138708.7
申请日:2024-01-31
Applicant: 上海富瀚微电子股份有限公司
Abstract: 本发明公开了一种声学警报识别方法及装置,属于音频信号处理技术领域,该声学警报识别方法,包括以下步骤:存储多个音调相同且固定的第一类源信号,并通过理想麦克风采集第一类源信号获得对应的理想麦克风信号,获取第一类源信号和理想麦克风信号之间的理想相关程度;提供待识别的输入信号,获取第一类源信号和输入信号之间的实际相关程度,第一类源信号、理想麦克风信号及输入信号具有相同的采样率;将理想相关程度和实际相关程度进行匹配,根据两者的匹配程度判断输入信号中是否含有第一类源信号。通过直接在时域进行识别,省去了DFT的资源消耗,提供了对于音调相同且固定的警报声的识别方法,只需要用到一个样本音频数据。
-
公开(公告)号:CN116224230A
公开(公告)日:2023-06-06
申请号:CN202211737274.X
申请日:2022-12-30
Applicant: 上海富瀚微电子股份有限公司
IPC: G01S5/22
Abstract: 本发明公开了一种声学相机的实现方法、装置及电子设备,所述方法包括以下步骤:步骤S1,根据声学相机的麦克风位置、拾取角度和像素点划分,计算出相位补偿斜率张量;步骤S2,将每个麦克风时域信号进行分帧加窗,根据需要处理的帧数将加窗结果求和,对求和结果进行时频分析,得到每个麦克风的频域信号;步骤S3,用分位数方法,将所述相位补偿斜率张量对每个麦克风频谱进行相位补偿,基于补偿后的频谱更新显示矩阵;步骤S4,将显示矩阵与实际的图形进行匹配,精确定位发声物体,通过本发明,提供一种计算量小的声学相机的实现方法。
-
公开(公告)号:CN118155645A
公开(公告)日:2024-06-07
申请号:CN202410283399.2
申请日:2024-03-13
Applicant: 上海富瀚微电子股份有限公司
IPC: G10L21/0216 , G10L21/034 , G10L25/18 , G10L25/30
Abstract: 本发明涉及音频信号处理技术领域,尤其涉及一种神经网络定向拾音方法、系统及可读存储介质,方法包括以下步骤:将麦克风阵置于坐标系中,规定增强方向,麦克风阵列至少包括一个麦克风对;对每个麦克风对在增强方向上接收的目标声源信号进行增强处理,得到目标声源增强信号及目标声源阻塞信号;将目标声源增强信号及目标声源阻塞信号转换成特征向量;将特征向量输入训练好的深度神经网络模型中,输出的增益作用于目标声源信号,得到增强信号。相比于传统的定向增强算法,本发明在拾取增强方向中混杂着非增强方向的声音时,在资源消耗提升不大的情形下能够对增强方向的声音进行更好的保留同时对非增强方向的声音进行更好的抑制。
-
公开(公告)号:CN116863951A
公开(公告)日:2023-10-10
申请号:CN202311055231.8
申请日:2023-08-21
Applicant: 上海富瀚微电子股份有限公司
Abstract: 本发明公开了一种声源定位及语音增强方法、装置,属于音频信号处理技术领域,该声源定位方法,包括以下步骤:对多个麦克风进行两两配对,根据麦克风对的位置、所需的定位精度获得至少部分的所述麦克风对中两个麦克风之间的频域相位补偿斜率张量;基于所述频域相位补偿斜率张量计算至少部分的所述麦克风对的频域互相关系数;使用分位数法扫描待拾取的空间范围,将各所述频域互相关系数之和最大的位置记为目标位置。通过设置相应的增益因子和补偿因子作用在求和结果和差分结果上,从而分别解决低频指向性差和环境噪声的问题,且可以灵活选择麦克风对的组合,提升定位效果和语音增强效果。
-
公开(公告)号:CN115862652A
公开(公告)日:2023-03-28
申请号:CN202211485063.1
申请日:2022-11-24
Applicant: 上海富瀚微电子股份有限公司
IPC: G10L21/0208 , G10L21/0216 , G10K11/178
Abstract: 本发明公开了一种频域幅值自适应滤波器设计方法及装置、电子设备,该方法包括:对时域参考信号与麦克风信号进行时频分析,得到各自的频域幅值;基于参考信号频域幅值与滤波器得到回声频域幅值初步估计信号,并获得残差信号;利用残差信号与参考信号对滤波器系数进行更新,得到本帧滤波器最优解;基于本帧滤波器最优解与参考信号重新进行回声估计,得到回声频域幅值二次估计;基于回声频域幅值二次估计和麦克风信号频域幅值得到维纳滤波系数,根据获得的维纳滤波系数对麦克风信号滤波得到自适应滤波输出信号。
-
公开(公告)号:CN114596874A
公开(公告)日:2022-06-07
申请号:CN202210203571.X
申请日:2022-03-03
Applicant: 上海富瀚微电子股份有限公司
IPC: G10L21/0216 , G10L21/0232
Abstract: 本发明公开了一种基于多麦克风的风噪抑制方法及装置,所述方法包括如下步骤:步骤S1,根据各麦克风的低频能量大小选择输出麦克风信号;步骤S2,根据所述输出麦克风信号与其他麦克风信号每个频点的能量大小关系对所述输出麦克风信号的风噪频点进行抑制;步骤S3,将主麦克风与其他麦克风信号进行差分,取低频信号进行风噪检测与风噪大小估计,结合风噪连续性特点进行风噪抑制。
-
公开(公告)号:CN118091542A
公开(公告)日:2024-05-28
申请号:CN202311548056.6
申请日:2023-11-17
Applicant: 上海富瀚微电子股份有限公司
Abstract: 本发明公开了一种声相仪及其实现方法、电子设备,属于音频和图像信号处理技术领域,该声相仪的实现方法,包括以下步骤:对每个麦克风的时域信号进行分帧后各自求和,根据所需的采样率对求和结果进行升采样,得到每个麦克风的升采样时域信号;选取若干个麦克风对的升采样时域信号并求互相关,在进行归一化处理后,根据麦克风对的间距对得到的互相关值求次方;将每个麦克风的采样点补偿张量的延迟补偿给互相关值,以获得显示矩阵定位发声物体。通过对互相关值求次方,保证无虚像产生,提高分辨率,相对于DAMAS算法,具有计算量小,易于部署的优点。
-
公开(公告)号:CN117351986A
公开(公告)日:2024-01-05
申请号:CN202311530092.X
申请日:2023-11-16
Applicant: 上海富瀚微电子股份有限公司
IPC: G10L21/0216 , G10L21/0232 , G10L25/18 , G10L25/21 , G10L25/24 , G10L25/87
Abstract: 本发明公开了一种噪声抑制方法及装置,属于音频处理技术领域,该噪声抑制方法,包括以下步骤:信号预处理,对获得的麦克风信号进行时频变换,计算其梅尔频带功率谱;噪声估计,基于最小值跟踪法和NN‑VAD估计噪声,利用预设参数对不同频带进行噪声估计修正;噪声抑制,使用OM‑LSA计算梅尔频带增强增益,获得每个频点的增益并和所述麦克风信号的频点相乘获得噪声抑制后的频域信号,将所述频域信号经过逆变换得到噪声抑制后的时域信号。通过对带噪的麦克风信号进行梅尔频带划分,然后利用基于最小值跟踪法结合NN‑VAD进行频带噪声估计,通过OM‑LSA进行频带增强增益的计算,保证了对噪声抑制的效果。
-
公开(公告)号:CN116990753A
公开(公告)日:2023-11-03
申请号:CN202310981613.7
申请日:2023-08-04
Applicant: 上海富瀚微电子股份有限公司
IPC: G01S5/22
Abstract: 本发明公开了一种利用声学相机定位发声物体的实现方法、装置及电子设备,属于音频和图像信号处理技术领域。该利用声学相机定位发声物体的实现方法,包括:根据麦克风位置、拾取空间范围及拾取空间范围上的像素点划分,获得每个麦克风的采样点补偿张量;对每个麦克风的时域信号进行分帧后分别求和,根据所需的采样率对求和结果进行升采样,得到每个麦克风的升采样时域信号;使用分位数法将每个麦克风的采样点补偿张量代入对应的升采样时域信号,对每个麦克风信号进行时延补偿,根据每个麦克风信号获得显示矩阵;定位发声物体。直接在时域进行处理,省去了每个麦克风的时频变换操作,并且升采样之前进行分帧求和,降低了计算量。
-
-
-
-
-
-
-
-
-