-
公开(公告)号:CN110764520A
公开(公告)日:2020-02-07
申请号:CN201810842962.X
申请日:2018-07-27
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本发明公开了一种飞行器控制方法、装置、飞行器和存储介质,属于飞控技术领域。所述方法应用在飞行器中,飞行器包括语音采集阵列,语音采集阵列包括多个语音采集单元,方法包括:分别通过多个语音采集单元对语音信号进行采集,得到多路音频信号,一个语音采集单元采集一路音频信号;根据多路音频信号和每个语音采集单元在飞行器中的位置,确定该语音信号的声源方向;根据该声源方向,将多路音频信号进行波束形成,得到语音指令;将该语音指令转换为控制指令,根据该控制指令对飞行器进行控制。本发明中用户不需要通过控制设备,直接通过语音即可实现对飞行器的控制,提高了飞行器的实用性。
-
公开(公告)号:CN110248197A
公开(公告)日:2019-09-17
申请号:CN201810185895.9
申请日:2018-03-07
Applicant: 杭州海康威视数字技术股份有限公司
IPC: H04N21/218 , H04N21/233 , H04N21/234 , G06T3/40
Abstract: 本申请公开了一种语音增强方法及装置,属于多媒体处理领域。所述方法包括:获取目标图像,目标图像包括N个图像区域;当接收到N个图像区域中目标图像区域上的预设操作时,确定与目标图像区域对应的目标空间方向,并对目标空间方向对应的声音信号进行语音增强处理。本申请通过语音增强系统根据用户通过预设操作所指定的目标图像区域进行声源定位,进而使得定位出的目标空间方向即为用户所需要增强语音的方向,从而提高了声源定位的准确性和增强后的声音信号的质量,大大提供了语音增强系统的性能。
-
公开(公告)号:CN110797042A
公开(公告)日:2020-02-14
申请号:CN201810878964.4
申请日:2018-08-03
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G10L21/0216
Abstract: 本申请公开了一种音频处理方法、装置及存储介质,属于语音处理技术领域。该方法包括:获取多个音频采样频点对应的波束形成系数矩阵,获取到的多个波束形成系数矩阵是基于从麦克风阵列对应的圆形区域内选取的目标扇形区域确定的,多个波束形成系数矩阵用于控制在目标扇形区域指代的音频采集区域内采集的音频信号为静音状态,分别确定麦克风阵列中每个麦克风采集的音频信号在多个音频采样频点下的频域信号,将每个波束形成系数矩阵作为每个麦克风在对应音频采样频点下的频域信号的系数,对确定的频域信号进行变换处理,得到目标音频信号。本申请在不影响采集需求的音频信号的情况下,可以抑制掉需要静音的目标扇形区域的音频信号。
-
公开(公告)号:CN110890100A
公开(公告)日:2020-03-17
申请号:CN201811051587.3
申请日:2018-09-10
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G10L21/0216 , G10L21/0232 , H04N7/18 , H04N21/43
Abstract: 本申请提供一种语音增强方法及装置、语音采集方法及装置、多媒体数据采集方法及装置、多媒体数据播放方法及装置、以及监控系统。其中,语音增强方法包括:确定基于麦克风阵列得到的多路频域音频数据;以及确定所述麦克风阵列中每个麦克风的坐标信息;根据所述多路频域音频数据和所述每个麦克风的坐标信息确定声源角度信息;根据所述声源角度信息对所述多路频域音频数据进行增强处理,得到增强的目标频域音频数据。本申请可以根据麦克风阵列中每个麦克风的坐标信息和多路频域音频数据,确定声源角度信息,从而精准地对声源所发出的语音进行针对性地增强,使得增强后的音频数据播放起来更加清晰。
-
公开(公告)号:CN110890100B
公开(公告)日:2022-11-18
申请号:CN201811051587.3
申请日:2018-09-10
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G10L21/0216 , G10L21/0232 , H04N7/18 , H04N21/43
Abstract: 本申请提供一种语音增强方法及装置、语音采集方法及装置、多媒体数据采集方法及装置、多媒体数据播放方法及装置、以及监控系统。其中,语音增强方法包括:确定基于麦克风阵列得到的多路频域音频数据;以及确定所述麦克风阵列中每个麦克风的坐标信息;根据所述多路频域音频数据和所述每个麦克风的坐标信息确定声源角度信息;根据所述声源角度信息对所述多路频域音频数据进行增强处理,得到增强的目标频域音频数据。本申请可以根据麦克风阵列中每个麦克风的坐标信息和多路频域音频数据,确定声源角度信息,从而精准地对声源所发出的语音进行针对性地增强,使得增强后的音频数据播放起来更加清晰。
-
公开(公告)号:CN110797042B
公开(公告)日:2022-04-15
申请号:CN201810878964.4
申请日:2018-08-03
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G10L21/0216
Abstract: 本申请公开了一种音频处理方法、装置及存储介质,属于语音处理技术领域。该方法包括:获取多个音频采样频点对应的波束形成系数矩阵,获取到的多个波束形成系数矩阵是基于从麦克风阵列对应的圆形区域内选取的目标扇形区域确定的,多个波束形成系数矩阵用于控制在目标扇形区域指代的音频采集区域内采集的音频信号为静音状态,分别确定麦克风阵列中每个麦克风采集的音频信号在多个音频采样频点下的频域信号,将每个波束形成系数矩阵作为每个麦克风在对应音频采样频点下的频域信号的系数,对确定的频域信号进行变换处理,得到目标音频信号。本申请在不影响采集需求的音频信号的情况下,可以抑制掉需要静音的目标扇形区域的音频信号。
-
公开(公告)号:CN110764520B
公开(公告)日:2023-03-24
申请号:CN201810842962.X
申请日:2018-07-27
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本发明公开了一种飞行器控制方法、装置、飞行器和存储介质,属于飞控技术领域。所述方法应用在飞行器中,飞行器包括语音采集阵列,语音采集阵列包括多个语音采集单元,方法包括:分别通过多个语音采集单元对语音信号进行采集,得到多路音频信号,一个语音采集单元采集一路音频信号;根据多路音频信号和每个语音采集单元在飞行器中的位置,确定该语音信号的声源方向;根据该声源方向,将多路音频信号进行波束形成,得到语音指令;将该语音指令转换为控制指令,根据该控制指令对飞行器进行控制。本发明中用户不需要通过控制设备,直接通过语音即可实现对飞行器的控制,提高了飞行器的实用性。
-
公开(公告)号:CN110248197B
公开(公告)日:2021-10-22
申请号:CN201810185895.9
申请日:2018-03-07
Applicant: 杭州海康威视数字技术股份有限公司
IPC: H04N21/218 , H04N21/233 , H04N21/234 , G06T3/40
Abstract: 本申请公开了一种语音增强方法及装置,属于多媒体处理领域。所述方法包括:获取目标图像,目标图像包括N个图像区域;当接收到N个图像区域中目标图像区域上的预设操作时,确定与目标图像区域对应的目标空间方向,并对目标空间方向对应的声音信号进行语音增强处理。本申请通过语音增强系统根据用户通过预设操作所指定的目标图像区域进行声源定位,进而使得定位出的目标空间方向即为用户所需要增强语音的方向,从而提高了声源定位的准确性和增强后的声音信号的质量,大大提供了语音增强系统的性能。
-
-
-
-
-
-
-