-
公开(公告)号:CN110798790A
公开(公告)日:2020-02-14
申请号:CN201810863351.3
申请日:2018-08-01
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本发明公开了一种麦克风异常检测方法、装置及存储介质,属于终端技术领域。所述方法包括:播放用于测试异常麦克风的源音频,并确定目标麦克风基于源音频采集的测试音频,然后根据测试音频的频域特征向量和源音频的频域特征向量之间的相似度,来判断目标麦克风是否为异常麦克风。也即是,在本发明实施例中,可以对目标麦克风单独进行异常检测,而不是需要结合其他麦克风采集的测试音频才能判断目标麦克风是否为异常麦克风。这样的话,就可以避免出现相关技术中在两路以上的麦克风为异常麦克风时检测异常麦克风有误的情况,从而提高了检测异常麦克风的准确性。
-
公开(公告)号:CN110764520A
公开(公告)日:2020-02-07
申请号:CN201810842962.X
申请日:2018-07-27
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本发明公开了一种飞行器控制方法、装置、飞行器和存储介质,属于飞控技术领域。所述方法应用在飞行器中,飞行器包括语音采集阵列,语音采集阵列包括多个语音采集单元,方法包括:分别通过多个语音采集单元对语音信号进行采集,得到多路音频信号,一个语音采集单元采集一路音频信号;根据多路音频信号和每个语音采集单元在飞行器中的位置,确定该语音信号的声源方向;根据该声源方向,将多路音频信号进行波束形成,得到语音指令;将该语音指令转换为控制指令,根据该控制指令对飞行器进行控制。本发明中用户不需要通过控制设备,直接通过语音即可实现对飞行器的控制,提高了飞行器的实用性。
-
公开(公告)号:CN110248197A
公开(公告)日:2019-09-17
申请号:CN201810185895.9
申请日:2018-03-07
Applicant: 杭州海康威视数字技术股份有限公司
IPC: H04N21/218 , H04N21/233 , H04N21/234 , G06T3/40
Abstract: 本申请公开了一种语音增强方法及装置,属于多媒体处理领域。所述方法包括:获取目标图像,目标图像包括N个图像区域;当接收到N个图像区域中目标图像区域上的预设操作时,确定与目标图像区域对应的目标空间方向,并对目标空间方向对应的声音信号进行语音增强处理。本申请通过语音增强系统根据用户通过预设操作所指定的目标图像区域进行声源定位,进而使得定位出的目标空间方向即为用户所需要增强语音的方向,从而提高了声源定位的准确性和增强后的声音信号的质量,大大提供了语音增强系统的性能。
-
公开(公告)号:CN109427340A
公开(公告)日:2019-03-05
申请号:CN201710725576.8
申请日:2017-08-22
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本发明实施例提供了一种语音增强方法、装置及电子设备,方法包括:获取待增强语音数据,并提取语音数据的特征值;将特征值输入至预先训练得到的深层神经网络模型,得到增强特征值;其中,深层神经网络模型为:对包含噪声的语音样本及其对应的不包含噪声的语音样本进行训练得到;根据增强特征值,对语音数据进行波形重构,得到增强后的语音数据。可见,本方案中,利用深层神经网络模型进行语音增强,该深层神经网络模型基于大量语音样本(不包含噪声的语音样本及包含噪声的语音样本)训练得到,携带有丰富的语音信息,即使场景中出现异常噪声,语音增强效果不受影响,相比于现有方案,提高了语音增强效果。
-
公开(公告)号:CN108231085A
公开(公告)日:2018-06-29
申请号:CN201611154066.1
申请日:2016-12-14
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G10L21/0216 , G10L21/0224 , G10L25/27 , G01S5/20
Abstract: 本发明实施例公开了一种声源定位方法及装置,所述方法包括:获得麦克风阵列中各个麦克风采集的目标音频信号;对各个麦克风采集的目标音频信号进行分帧处理,并根据分帧结果,确定各个麦克风所对应的目标音频帧;计算目标音频帧所对应的目标时延向量;将目标时延向量输入至预先训练完成的目标机器学习模型,得到目标方位角标识值;基于目标方位角标识值,得到目标音频信号的声源所对应的目标方位角。由于目标机器学习模型是以实际应用场景中所采集到的音频帧样本对应的时延向量样本作为输入内容,且以音频信号样本对应的方位角标识值作为输出内容所训练得到的机器学习模型,所以即使在时延计算不够精确的情况下,也能够准确确定声源的方位角。
-
公开(公告)号:CN108089152A
公开(公告)日:2018-05-29
申请号:CN201611047345.8
申请日:2016-11-23
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本发明实施例提供了一种设备控制方法、装置及系统,所述方法应用于声源定位系统中的视频采集设备,该声源定位系统还包括设置于视频采集设备外部的麦克风,所述方法包括:获取各麦克风采集的语音信号,并获取所述各麦克风的坐标信息,以及各预设位置点的坐标信息;根据所述各麦克风采集的语音信号、所述各麦克风的坐标信息、以及各预设位置点的坐标信息,计算各位置点对应的语音功率值;识别语音功率值最大的位置点,将该位置点确定为声源位置,并控制自身对准所述声源位置。本发明实施例中,将麦克风设置在视频采集设备外部,采集场景中的声音均能被麦克风采集到,因此,能够提高声源定位的准确性,从而提高设备控制的准确性。
-
公开(公告)号:CN119049454A
公开(公告)日:2024-11-29
申请号:CN202411536185.8
申请日:2024-10-31
Applicant: 杭州海康威视数字技术股份有限公司
Inventor: 陈扬坤
IPC: G10L15/06 , G10L15/16 , G10L21/0232 , G10L21/0264 , G10L21/0216
Abstract: 本申请实施例提供了一种模型训练方法、声音信号处理方法、装置,涉及信号处理技术领域,具体实现方案为:获取多个样本对;针对每一样本对中的无噪声音信号和带噪声音信号分别进行傅里叶变换,得到第一频域信号和第二频域信号;利用初始的预测模型第二频域信号进行处理,得到第一预测向量;将该样本对对应的第一预测向量分别与第一频域信号和第二频域信号相乘,得到第一输出向量,和第二输出向量;基于多个样本对各自对应第一输出向量和第二输出向量之间的差异,计算模型损失值;基于模型损失值,对预测模型的模型参数进行调整。可见,通过本方案,能够准确预测出麦克风阵列的频响范围中每一频率点对应的信噪比。
-
公开(公告)号:CN113362850B
公开(公告)日:2024-05-28
申请号:CN202010140336.3
申请日:2020-03-03
Applicant: 杭州海康威视数字技术股份有限公司
Inventor: 陈扬坤
Abstract: 本申请提供一种音频信号采集设备的检测方法、设备和存储介质。该方法包括:获取所述音频信号采集设备采集的至少一路音频信号;分别提取各路所述音频信号的幅值特征;根据各路所述音频信号的幅值特征,利用预先训练得到的机器学习模型,确定所述音频信号采集设备是否异常。本申请实施例提高了检测结果的准确性。
-
公开(公告)号:CN116844343A
公开(公告)日:2023-10-03
申请号:CN202310771496.1
申请日:2023-06-27
Applicant: 杭州海康威视数字技术股份有限公司
Inventor: 陈扬坤
IPC: G08G1/017 , G10L21/0216
Abstract: 本发明公开了一种声源声音强度估计方法、装置、设备及计算机可读存储介质,所述方法包括:基于麦克风阵列采集的声音信号和摄像设备采集的视频数据定位车辆声源相对于麦克风阵列的角度;根据车辆声源相对于麦克风阵列的角度和麦克风阵列的安装位置信息,计算得到车辆声源与麦克风阵列之间的距离;根据距离和麦克风阵列采集到的车辆声源的声音信号的强度数据,计算得到车辆声源处的声音强度数据。本发明提高了所估计出的车辆声源的噪声强度的准确度,进而利于提高对交通噪声的监测和管理精准度。
-
公开(公告)号:CN111770427B
公开(公告)日:2023-01-24
申请号:CN202010588457.4
申请日:2020-06-24
Applicant: 杭州海康威视数字技术股份有限公司
Inventor: 陈扬坤
IPC: H04R29/00 , G10L21/0224 , G10L21/0232 , G10L25/18 , G10L25/24 , G10L25/30 , G10L25/45
Abstract: 本申请提供一种麦克风阵列的检测方法、装置、设备以及存储介质。该方法通过根据麦克风阵列采集的音频信号的音频特征,确定所述音频信号是否包含违规声音信号,并在所述音频信号包含违规声音信号时,对音频信号进行特征提取,得到每帧音频信号的时频特征,时频特征用于指示该路音频信号的频域幅度特征和时域能量特征,并将每帧音频信号的时频特征输入到预训练得到的麦克风异常检测模型,得到麦克风阵列中各麦克风是否异常的检测结果,提高对用于采集违规声音的麦克风阵列检测的准确性。
-
-
-
-
-
-
-
-
-