-
公开(公告)号:CN110555918A
公开(公告)日:2019-12-10
申请号:CN201810556426.3
申请日:2018-06-01
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本公开是关于一种考勤管理的方法和考勤管理设备,属于电子技术领域。所述方法包括:获取音频采集装置采集的第一人声音频的第一声纹特征;将第一声纹特征,输入预先训练的每个认证用户的声纹匹配识别模型中,得到第一声纹特征与每个认证用户的声纹匹配度;如果得到的声纹匹配度中存在大于预设阈值的目标声纹匹配度,则确定目标声纹匹配度对应的第一认证用户,在第一数据库中添加与第一认证用户对应的考勤记录;当基于第一数据库中的考勤记录确定在预设时间段内考勤场所中不存在认证用户时,进行报警处理。采用本公开,可以降低因为考勤场所中无人在岗而出现事故的概率。
-
公开(公告)号:CN110248197A
公开(公告)日:2019-09-17
申请号:CN201810185895.9
申请日:2018-03-07
Applicant: 杭州海康威视数字技术股份有限公司
IPC: H04N21/218 , H04N21/233 , H04N21/234 , G06T3/40
Abstract: 本申请公开了一种语音增强方法及装置,属于多媒体处理领域。所述方法包括:获取目标图像,目标图像包括N个图像区域;当接收到N个图像区域中目标图像区域上的预设操作时,确定与目标图像区域对应的目标空间方向,并对目标空间方向对应的声音信号进行语音增强处理。本申请通过语音增强系统根据用户通过预设操作所指定的目标图像区域进行声源定位,进而使得定位出的目标空间方向即为用户所需要增强语音的方向,从而提高了声源定位的准确性和增强后的声音信号的质量,大大提供了语音增强系统的性能。
-
公开(公告)号:CN109427340A
公开(公告)日:2019-03-05
申请号:CN201710725576.8
申请日:2017-08-22
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本发明实施例提供了一种语音增强方法、装置及电子设备,方法包括:获取待增强语音数据,并提取语音数据的特征值;将特征值输入至预先训练得到的深层神经网络模型,得到增强特征值;其中,深层神经网络模型为:对包含噪声的语音样本及其对应的不包含噪声的语音样本进行训练得到;根据增强特征值,对语音数据进行波形重构,得到增强后的语音数据。可见,本方案中,利用深层神经网络模型进行语音增强,该深层神经网络模型基于大量语音样本(不包含噪声的语音样本及包含噪声的语音样本)训练得到,携带有丰富的语音信息,即使场景中出现异常噪声,语音增强效果不受影响,相比于现有方案,提高了语音增强效果。
-
公开(公告)号:CN108231085A
公开(公告)日:2018-06-29
申请号:CN201611154066.1
申请日:2016-12-14
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G10L21/0216 , G10L21/0224 , G10L25/27 , G01S5/20
Abstract: 本发明实施例公开了一种声源定位方法及装置,所述方法包括:获得麦克风阵列中各个麦克风采集的目标音频信号;对各个麦克风采集的目标音频信号进行分帧处理,并根据分帧结果,确定各个麦克风所对应的目标音频帧;计算目标音频帧所对应的目标时延向量;将目标时延向量输入至预先训练完成的目标机器学习模型,得到目标方位角标识值;基于目标方位角标识值,得到目标音频信号的声源所对应的目标方位角。由于目标机器学习模型是以实际应用场景中所采集到的音频帧样本对应的时延向量样本作为输入内容,且以音频信号样本对应的方位角标识值作为输出内容所训练得到的机器学习模型,所以即使在时延计算不够精确的情况下,也能够准确确定声源的方位角。
-
公开(公告)号:CN108089152A
公开(公告)日:2018-05-29
申请号:CN201611047345.8
申请日:2016-11-23
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本发明实施例提供了一种设备控制方法、装置及系统,所述方法应用于声源定位系统中的视频采集设备,该声源定位系统还包括设置于视频采集设备外部的麦克风,所述方法包括:获取各麦克风采集的语音信号,并获取所述各麦克风的坐标信息,以及各预设位置点的坐标信息;根据所述各麦克风采集的语音信号、所述各麦克风的坐标信息、以及各预设位置点的坐标信息,计算各位置点对应的语音功率值;识别语音功率值最大的位置点,将该位置点确定为声源位置,并控制自身对准所述声源位置。本发明实施例中,将麦克风设置在视频采集设备外部,采集场景中的声音均能被麦克风采集到,因此,能够提高声源定位的准确性,从而提高设备控制的准确性。
-
公开(公告)号:CN108062959A
公开(公告)日:2018-05-22
申请号:CN201610979542.7
申请日:2016-11-08
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G10L21/0208 , G10L21/0264
Abstract: 本申请实施例提供了一种声音降噪方法及装置,涉及音频处理技术领域。所述方法包括:获取当前采样点的第一声音数据;获取第二声音数据,其中,第二声音数据为第二采样时刻采集的数据,第二采样时刻为第一采样时刻之前、与第一采样时刻最接近的预设数量个采样时刻,第一采样时刻为第一声音数据对应的采样时刻;根据第二声音数据,对第一声音数据进行滑动平滑处理;将处理后的采样数据,确定为所述第一声音数据降噪后的数据。应用本实施例的技术方案,能够从声音信号中去除突变型噪声,提高声音的品质。
-
公开(公告)号:CN110764520B
公开(公告)日:2023-03-24
申请号:CN201810842962.X
申请日:2018-07-27
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本发明公开了一种飞行器控制方法、装置、飞行器和存储介质,属于飞控技术领域。所述方法应用在飞行器中,飞行器包括语音采集阵列,语音采集阵列包括多个语音采集单元,方法包括:分别通过多个语音采集单元对语音信号进行采集,得到多路音频信号,一个语音采集单元采集一路音频信号;根据多路音频信号和每个语音采集单元在飞行器中的位置,确定该语音信号的声源方向;根据该声源方向,将多路音频信号进行波束形成,得到语音指令;将该语音指令转换为控制指令,根据该控制指令对飞行器进行控制。本发明中用户不需要通过控制设备,直接通过语音即可实现对飞行器的控制,提高了飞行器的实用性。
-
公开(公告)号:CN115547304A
公开(公告)日:2022-12-30
申请号:CN202211065534.3
申请日:2022-09-01
Applicant: 杭州海康威视数字技术股份有限公司
Inventor: 陈展
IPC: G10L15/04 , G10L15/02 , G10L15/08 , G10L21/0272 , G10L25/51 , G10L13/06 , G10L13/02 , G06Q50/20
Abstract: 本申请提供一种课堂分析方法及装置,涉及语音识别技术领域,可以通过确定课堂中两个学生或者学生与教师之间发出的音频之间的切换次数,进而精确分析课堂学生参与程度。该课堂分析方法包括:获取课堂音频数据;对课堂音频数据进行声纹识别,分割出课堂中各个声源个体的音频数据,声源个体包括教师和/或学生;根据课堂中各个声源个体的音频数据,确定第一切换次数和第二切换次数;根据第一切换次数和第二切换次数,确定课堂的课堂交互结构,课堂交互结构用于指示课堂中教师与学生的交互情况。
-
公开(公告)号:CN110555918B
公开(公告)日:2022-04-26
申请号:CN201810556426.3
申请日:2018-06-01
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本公开是关于一种考勤管理的方法和考勤管理设备,属于电子技术领域。所述方法包括:获取音频采集装置采集的第一人声音频的第一声纹特征;将第一声纹特征,输入预先训练的每个认证用户的声纹匹配识别模型中,得到第一声纹特征与每个认证用户的声纹匹配度;如果得到的声纹匹配度中存在大于预设阈值的目标声纹匹配度,则确定目标声纹匹配度对应的第一认证用户,在第一数据库中添加与第一认证用户对应的考勤记录;当基于第一数据库中的考勤记录确定在预设时间段内考勤场所中不存在认证用户时,进行报警处理。采用本公开,可以降低因为考勤场所中无人在岗而出现事故的概率。
-
公开(公告)号:CN110248197B
公开(公告)日:2021-10-22
申请号:CN201810185895.9
申请日:2018-03-07
Applicant: 杭州海康威视数字技术股份有限公司
IPC: H04N21/218 , H04N21/233 , H04N21/234 , G06T3/40
Abstract: 本申请公开了一种语音增强方法及装置,属于多媒体处理领域。所述方法包括:获取目标图像,目标图像包括N个图像区域;当接收到N个图像区域中目标图像区域上的预设操作时,确定与目标图像区域对应的目标空间方向,并对目标空间方向对应的声音信号进行语音增强处理。本申请通过语音增强系统根据用户通过预设操作所指定的目标图像区域进行声源定位,进而使得定位出的目标空间方向即为用户所需要增强语音的方向,从而提高了声源定位的准确性和增强后的声音信号的质量,大大提供了语音增强系统的性能。
-
-
-
-
-
-
-
-
-