-
公开(公告)号:CN107545904B
公开(公告)日:2021-06-18
申请号:CN201610480405.9
申请日:2016-06-23
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本发明实施例公开了一种音频检测方法及装置,将待检测音频划分为第一预设数量个音频段,采取相同的方式获取每个音频段及音频样本对应的信息集合,计算每个音频段对应的信息集合与音频样本对应的信息集合的相似度,当计算得到的相似度的平均值大于第一预设阈值时,将该音频样本的属性确定为该待检测音频的属性。这样可以仅在待检测音频的属性为需要关注的音频属性时,向监控方发送该音频或提示信息,降低了资源占用率,提高了监控的有效性。
-
公开(公告)号:CN108089152B
公开(公告)日:2020-07-03
申请号:CN201611047345.8
申请日:2016-11-23
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本发明实施例提供了一种设备控制方法、装置及系统,所述方法应用于声源定位系统中的视频采集设备,该声源定位系统还包括设置于视频采集设备外部的麦克风,所述方法包括:获取各麦克风采集的语音信号,并获取所述各麦克风的坐标信息,以及各预设位置点的坐标信息;根据所述各麦克风采集的语音信号、所述各麦克风的坐标信息、以及各预设位置点的坐标信息,计算各位置点对应的语音功率值;识别语音功率值最大的位置点,将该位置点确定为声源位置,并控制自身对准所述声源位置。本发明实施例中,将麦克风设置在视频采集设备外部,采集场景中的声音均能被麦克风采集到,因此,能够提高声源定位的准确性,从而提高设备控制的准确性。
-
公开(公告)号:CN110874909A
公开(公告)日:2020-03-10
申请号:CN201810994280.0
申请日:2018-08-29
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本发明是关于一种监控方法、系统及可读存储介质。所述监控方法包括:判断声音采集设备采集的语音是否为目标语音;当判断出所述第一声音采集设备采集的语音为目标语音时,获取目标语音的声源位置,并依据所述声源位置确定目标区域;在图像采集设备采集的所述目标区域的图像中检测目标对象,当检测到所述目标对象时,输出告警提示。本发明通过声音采集设备采集的语音和图像采集设备采集的图片结合来进行监控,相对于现有技术中单纯的视频监控,可提高监控的可信度。
-
公开(公告)号:CN110767214A
公开(公告)日:2020-02-07
申请号:CN201810848234.X
申请日:2018-07-27
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本发明公开了一种语音识别装置及其装置和语音识别系统,该方法包括:对获取的音频信号进行特征提取,得到多个语音特征值;将所述多个语音特征值输入到声学模型中进行识别,得到多个发音音素的概率;根据所述多个发音音素的概率获取其中若干个连续发音音素组成预设关键词的概率;判断组成所述预设关键词的概率是否大于概率阈值,若是,则确定所述音频信号中存在所述预设关键词。该方法可以降低语音识别的计算量,降低应用该识别方法的硬件要求。
-
公开(公告)号:CN108174143A
公开(公告)日:2018-06-15
申请号:CN201611115113.1
申请日:2016-12-07
Applicant: 杭州海康威视数字技术股份有限公司
IPC: H04N7/15
Abstract: 本发明实施例提供了一种监控设备控制方法及装置,该方法中,实时获取其他会议端的监控设备发送的第一声音信号,并接收自身麦克风阵列采集的第二声音信号;根据所获取的第一声音信号,判断所接收到的第二声音信号是否为通过本端声音播放装置发出的;如果否,确定所接收到的第二声音信号对应的声源的位置;对准所述声源的位置。本发明实施例中,在确定所接收到的第二声音信号不为通过本端声音播放装置发出的情况下,再确定所接收到的第二声音信号对应的声源的位置,对准所述声源的位置,由此,避免了由于本端声音播放装置发出的其他会议端的声音信号所导致的声源定位错误,保证了监控设备声源定位的准确性。
-
公开(公告)号:CN108089153A
公开(公告)日:2018-05-29
申请号:CN201611046953.7
申请日:2016-11-23
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G01S5/22
Abstract: 本发明实施例提供了一种声源定位方法、装置及系统,所述方法应用于声源定位系统中的视频采集设备,所述声源定位系统还包括设置于所述视频采集设备外部的麦克风,所述方法包括:获取各麦克风采集的语音信号,并获取所述各麦克风的坐标信息,以及各预设位置点的坐标信息;根据所述各麦克风采集的语音信号、所述各麦克风的坐标信息、以及各预设位置点的坐标信息,计算各位置点对应的语音功率值;识别语音功率值最大的位置点,并将该位置点确定为声源位置。本发明实施例中,将麦克风设置在视频采集设备外部,采集场景中的声音均能被麦克风采集到,因此,能够提高声源定位的准确性。
-
公开(公告)号:CN108076316A
公开(公告)日:2018-05-25
申请号:CN201611024002.X
申请日:2016-11-18
Applicant: 杭州海康威视数字技术股份有限公司
Inventor: 陈展
Abstract: 本发明实施例提供了一种识别改装车辆的方法、装置及系统,应用于视频采集设备,所述方法包括:采集包含通行车辆声音的音频信息;对所述音频信息进行特征提取,获取所述音频信息中包括的预设特征信息;判断所述预设特征信息是否满足预设条件;如果是,确定通行车辆中包含改装车辆。通常情况下,改装过发动机或排气口的车辆的声音会与原出厂车辆不同,因此,本发明实施例中,通过对采集的包含通行车辆声音的音频信息进行预设特征提取与分析,能够识别改装过发动机或排气口的车辆。
-
公开(公告)号:CN119170009B
公开(公告)日:2025-03-07
申请号:CN202411293713.1
申请日:2024-09-12
Applicant: 杭州海康威视数字技术股份有限公司
Inventor: 陈展
Abstract: 本申请实施例提供了一种行为检测方法、系统、装置、设备以及存储介质,涉及语音识别技术领域。具体实现方案为:接收待检测数据;其中,所述待检测数据为:前端设备对第一待检测特征进行霸凌关键词识别,并在关键词识别结果表示待检测音频中包含霸凌关键词的情况下所上传的,所述第一待检测特征为:所述前端设备对当前所处环境中采集到的待检测音频进行频域特征提取得到的,所述待检测数据用于表征所述待检测音频;利用预先训练的音频大模型对所述待检测数据进行意图识别,得到表示所述待检测音频的采集环境中是否存在霸凌行为的检测结果。可见,通过本方案,可以有效检测出霸凌行为。
-
公开(公告)号:CN110826358B
公开(公告)日:2022-12-06
申请号:CN201810894999.7
申请日:2018-08-08
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本发明公开了一种动物情绪的识别方法、装置及存储介质,属于数据处理技术领域。该方法包括:获取待识别的目标动物的行为数据,该行为数据包括视频画面数据和/或声音数据,根据该行为数据,确定与该目标动物的种类对应的目标识别模型,对该行为数据进行预处理,得到至少一个行为特征向量,该至少一个行为特征向量包括肢体特征向量和/或声音特征向量,调用该目标识别模型,将该至少一个行为特征向量输入该目标识别模型中,输出该目标动物的情绪标签。本发明实施例可以基于目标动物的任一种行为进行情绪识别,解决了采用人工识别时由于人工经验有限导致动物一些不经常出现的行为可能无法识别的问题。
-
公开(公告)号:CN110659542B
公开(公告)日:2022-10-21
申请号:CN201810701223.9
申请日:2018-06-29
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本发明公开了一种监控方法及装置,属于监控技术领域。所述方法包括:获取考场的目标监控图像和目标声音信息;调用违规动作识别模型,将目标监控图像输入到违规动作识别模型;调用违规声音识别模型,将目标声音信息输入到所述违规声音识别模型;若通过违规动作识别模型识别出违规动作,且通过违规声音识别模型识别出违规声音,则确定该考场存在疑似作弊行为。本发明通过利用违规动作识别模型和违规声音模型,分别对考场图像中的违规动作和考场声音中的违规声音进行识别,提高了监考效率和检测作弊行为的准确度。
-
-
-
-
-
-
-
-
-