-
公开(公告)号:CN112911465B
公开(公告)日:2022-09-02
申请号:CN202110138609.5
申请日:2021-02-01
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本发明实施例提供了信号发送方法、装置及电子设备,该方法包括:获取语音信号,其中,语音信号是针对交互现场进行语音采集的麦克风阵列所采集的;基于预设的波束形成算法,对所获取的语音信号进行波束生成,得到多个波束方向不同的语音波束;获取远端音源信息,其中,远端音源信息用于指示交互现场中远端音源相对麦克风阵列的方向;从多个语音波束中,确定波束方向与远端音源信息所指示方向不同的语音波束,作为可用波束。通过本方案,可以提高语音交互系统的互动质量。
-
公开(公告)号:CN110890100A
公开(公告)日:2020-03-17
申请号:CN201811051587.3
申请日:2018-09-10
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G10L21/0216 , G10L21/0232 , H04N7/18 , H04N21/43
Abstract: 本申请提供一种语音增强方法及装置、语音采集方法及装置、多媒体数据采集方法及装置、多媒体数据播放方法及装置、以及监控系统。其中,语音增强方法包括:确定基于麦克风阵列得到的多路频域音频数据;以及确定所述麦克风阵列中每个麦克风的坐标信息;根据所述多路频域音频数据和所述每个麦克风的坐标信息确定声源角度信息;根据所述声源角度信息对所述多路频域音频数据进行增强处理,得到增强的目标频域音频数据。本申请可以根据麦克风阵列中每个麦克风的坐标信息和多路频域音频数据,确定声源角度信息,从而精准地对声源所发出的语音进行针对性地增强,使得增强后的音频数据播放起来更加清晰。
-
公开(公告)号:CN109669158A
公开(公告)日:2019-04-23
申请号:CN201710958145.6
申请日:2017-10-16
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G01S5/20
Abstract: 本发明实施例提供了一种声源定位方法、系统、计算机设备及存储介质,其中,声源定位方法包括:获取声音传感器阵列中属于第一传感器对和第二传感器对的各声音传感器接收到的声音信号;根据第一传感器对中各声音传感器分别接收到的声音信号,分别计算各预先划分的区域对应的第一传播功率;根据第二传感器对中各声音传感器分别接收到的声音信号,分别计算各预先划分的区域对应的第二传播功率;确定多个第一传播功率中的最大值对应的多个第一区域以及多个第二传播功率中的最大值对应的多个第二区域;定位多个第一区域与多个第二区域的重合区域的方向为声源的方向。通过本方案可以保证准确定位声源。
-
公开(公告)号:CN108965789A
公开(公告)日:2018-12-07
申请号:CN201710349350.2
申请日:2017-05-17
Applicant: 杭州海康威视数字技术股份有限公司
IPC: H04N7/18
Abstract: 本发明实施例提供了一种无人机监测方法及音视频联动装置,其中,无人机监测方法包括:通过音频采集阵列采集声音信号;对声音信号进行信号处理,获得声音信号中至少一个信号特征满足预设条件的声音分量;确定信号特征满足预设条件的声音分量对应的目标物体所在位置;控制摄像头对准目标物体所在位置;根据摄像头拍摄到的图像,判断目标物体是否为无人机。通过本方案可以实现对无人机的监控,从而保证社会及个人安全。
-
公开(公告)号:CN108063890A
公开(公告)日:2018-05-22
申请号:CN201610986171.5
申请日:2016-11-09
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本发明实施例提供了一种监控设备控制方法及装置,该方法中,接收麦克风阵列采集的声源的声音信号;确定所述声音信号在所述麦克风阵列的中心处的声强信息;根据所述声强信息,确定所述声音信号对应的声源的方位角;将所述声源的方位角发送至所述监控设备的电机,以使所述电机带动摄像头转动至朝向所述声源。由于本发明实施例中通过声强信息来确定声源的方位角,而并非通过时延来确定方位角,因此能够提高小型监控设备的声源定位结果的准确性。
-
公开(公告)号:CN107976651A
公开(公告)日:2018-05-01
申请号:CN201610917562.1
申请日:2016-10-21
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G01S5/20 , G10L21/0208 , G10L21/0216
CPC classification number: G10L21/0208 , G01S5/20 , G10L21/0216 , G10L2021/02166
Abstract: 本发明实施例公开了一种基于麦克风阵列的声源定位方法及装置,所述方法包括:获取经所述麦克风阵列传输的语音信号,对所述语音信号进行分帧处理,并确定目标语音信号;确定所述目标语音信号中的目标频率点,并根据所述目标频率点,针对所述麦克风阵列中的预设位置,分别确定各预设位置的声压信号;根据所述各预设位置的声压信号和预设方位角,计算各预设方位角对应的波束响应值,并基于所述各预设方位角对应的波束响应值,确定声源方位角。由于声压信号具有一定指向性,因此采用预设位置的声压信号计算波束响应值,进而确定声源的方位角,可以在麦克风阵列尺寸较小的微型阵列条件下准确地定位声源的方位。
-
公开(公告)号:CN107548007A
公开(公告)日:2018-01-05
申请号:CN201610485200.X
申请日:2016-06-23
Applicant: 杭州海康威视数字技术股份有限公司
IPC: H04R29/00
Abstract: 本发明实施例公开了一种音频信号采集设备检测方法及装置,方法包括:获得待检测的音频信号,提取该音频信号中的N帧时域音频数据,计算其能量值并判断与预设的能量值阈值的大小关系,若该能量值不小于该阈值,则将N帧时域音频数据转换为N帧频域音频数据,提取每一帧的谱峰频率,判断N帧频域音频数据的谱峰频率是否稳定,如果稳定,则判定音频信号采集设备连接异常。应用本发明实施例,可以提高检测音频信号采集设备是否连接异常的准确性。
-
公开(公告)号:CN110764520B
公开(公告)日:2023-03-24
申请号:CN201810842962.X
申请日:2018-07-27
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本发明公开了一种飞行器控制方法、装置、飞行器和存储介质,属于飞控技术领域。所述方法应用在飞行器中,飞行器包括语音采集阵列,语音采集阵列包括多个语音采集单元,方法包括:分别通过多个语音采集单元对语音信号进行采集,得到多路音频信号,一个语音采集单元采集一路音频信号;根据多路音频信号和每个语音采集单元在飞行器中的位置,确定该语音信号的声源方向;根据该声源方向,将多路音频信号进行波束形成,得到语音指令;将该语音指令转换为控制指令,根据该控制指令对飞行器进行控制。本发明中用户不需要通过控制设备,直接通过语音即可实现对飞行器的控制,提高了飞行器的实用性。
-
公开(公告)号:CN110248197B
公开(公告)日:2021-10-22
申请号:CN201810185895.9
申请日:2018-03-07
Applicant: 杭州海康威视数字技术股份有限公司
IPC: H04N21/218 , H04N21/233 , H04N21/234 , G06T3/40
Abstract: 本申请公开了一种语音增强方法及装置,属于多媒体处理领域。所述方法包括:获取目标图像,目标图像包括N个图像区域;当接收到N个图像区域中目标图像区域上的预设操作时,确定与目标图像区域对应的目标空间方向,并对目标空间方向对应的声音信号进行语音增强处理。本申请通过语音增强系统根据用户通过预设操作所指定的目标图像区域进行声源定位,进而使得定位出的目标空间方向即为用户所需要增强语音的方向,从而提高了声源定位的准确性和增强后的声音信号的质量,大大提供了语音增强系统的性能。
-
公开(公告)号:CN107545904B
公开(公告)日:2021-06-18
申请号:CN201610480405.9
申请日:2016-06-23
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本发明实施例公开了一种音频检测方法及装置,将待检测音频划分为第一预设数量个音频段,采取相同的方式获取每个音频段及音频样本对应的信息集合,计算每个音频段对应的信息集合与音频样本对应的信息集合的相似度,当计算得到的相似度的平均值大于第一预设阈值时,将该音频样本的属性确定为该待检测音频的属性。这样可以仅在待检测音频的属性为需要关注的音频属性时,向监控方发送该音频或提示信息,降低了资源占用率,提高了监控的有效性。
-
-
-
-
-
-
-
-
-