-
公开(公告)号:CN112992127A
公开(公告)日:2021-06-18
申请号:CN201911275670.3
申请日:2019-12-12
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本申请公开了一种语音识别的方法,属于语音识别领域。所述方法包括:接收终端发送的语音识别请求,其中,所述语音识别请求中携带有待识别语音数据和对应的第一领域标识;基于所述第一领域标识,以及预先存储的领域标识和领域语音识别模型的对应关系,确定用于识别所述待识别语音数据的领域语音识别模型;基于所述用于识别所述待识别语音数据的领域语音识别模型,确定所述待识别语音数据对应的结果文本数据;向所述终端发送所述结果文本数据。通过本申请可以提供语音识别的准确性。
-
公开(公告)号:CN110852084B
公开(公告)日:2021-04-02
申请号:CN201810846953.8
申请日:2018-07-27
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G06F40/284
Abstract: 本发明实施例提供的一种文本生成方法、装置及设备,通过针对待生成文本的固定写作格式中的每个模块,从预设资料库中获取符合该模块的需求信息的多个有效文本。针对每个模块,将该模块的多个有效文本分别输入预先训练得到的第一循环神经网络,得到每个有效文本的第一特征向量。针对每个模块,将每个有效文本的第一特征向量分别输入预先训练得到的记忆网络,得到每个有效文本中的各分词在第一待生成文本中的第一位置信息,第一待生成文本为该模块对应的文本,排列每个有效文本中的各分词,得到第一待生成文本。按照待生成文本的固定写作格式,排列每个模块的第一待生成文本,得到待生成文本。从而得到符合自然语言表述结构的待生成文本。
-
公开(公告)号:CN107919134B
公开(公告)日:2021-04-02
申请号:CN201610883702.8
申请日:2016-10-10
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G10L21/0208 , G10L21/0232 , G10L21/0264 , G10L25/21 , H04R3/04
Abstract: 本发明实施例提供啸叫检测方法及装置和啸叫抑制方法及装置,该啸叫检测方法包括:获得待检测音频帧在频域空间内的候选频率点;确定每个候选频率点各自对应的至少一个参考频率点;计算每个候选频率点与其对应的各个参考频率点之间的功率比值;基于相对应的功率比值,分别判断每个候选频率点是否为啸叫频率点;当判断结果表明存在啸叫频率点时确定待检测音频产生啸叫。应用本发明实施例提供的方案进行啸叫检测时,能够针对每一候选频率点确定至少一个与其对应的参考频率点,然后计算每个候选频率点与其对应的各个参考频率点的功率比值,避免了采用平均功率进行比较时导致的将低频部分的正常频率点误判为啸叫频率点的问题,提高了啸叫检测的准确率。
-
公开(公告)号:CN111311860A
公开(公告)日:2020-06-19
申请号:CN201811518480.5
申请日:2018-12-12
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G08B13/16
Abstract: 本申请实施例提供了一种区域入侵检测方法及装置。其中,方法包括:采集待检测区域中的脚步声,得到脚步声信号;提取所述脚步声信号的声纹特征,作为待验证声纹特征;基于所述待验证声纹特征与已认证声纹特征的相似度,确定所述脚步声是否为授权人员的脚步声,所述已认证声纹特征为从已认证人员的脚步声信号中提取到的声纹特征;如果所述脚步声不为所述授权人员的脚步声,确定所述待检测区域发生区域入侵。由于入侵人员在待检测区域移动过程中难以避免发出脚步声,并且脚步声不容易受到障碍物的阻碍,因此区域入侵检测的盲区较小。
-
公开(公告)号:CN110890100A
公开(公告)日:2020-03-17
申请号:CN201811051587.3
申请日:2018-09-10
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G10L21/0216 , G10L21/0232 , H04N7/18 , H04N21/43
Abstract: 本申请提供一种语音增强方法及装置、语音采集方法及装置、多媒体数据采集方法及装置、多媒体数据播放方法及装置、以及监控系统。其中,语音增强方法包括:确定基于麦克风阵列得到的多路频域音频数据;以及确定所述麦克风阵列中每个麦克风的坐标信息;根据所述多路频域音频数据和所述每个麦克风的坐标信息确定声源角度信息;根据所述声源角度信息对所述多路频域音频数据进行增强处理,得到增强的目标频域音频数据。本申请可以根据麦克风阵列中每个麦克风的坐标信息和多路频域音频数据,确定声源角度信息,从而精准地对声源所发出的语音进行针对性地增强,使得增强后的音频数据播放起来更加清晰。
-
公开(公告)号:CN110851560A
公开(公告)日:2020-02-28
申请号:CN201810848138.5
申请日:2018-07-27
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G06F16/33 , G06F16/332 , G06F40/289 , G06F40/30
Abstract: 本发明实施例提供的一种信息检索方法、装置及设备,通过利用预设语义依存算法待回答文本内容,得到包括待回答文本内容的事件关系信息和待回答文本内容中分词的角色标注信息的第一分析结果。基于第一分析结果,检索第一知识库,得到第一检索结果。其中,第一检索结果为与第一分析结果对应的答案,第一知识库包括答案,以及预设的第一分析结果与答案的对应关系。实现了语义层面的答案检索,从而避免以句法成分从文字层面检索造成的答案与咨询语义不相符的问题,提高了智能问答的信息检索准确性。
-
公开(公告)号:CN109669158A
公开(公告)日:2019-04-23
申请号:CN201710958145.6
申请日:2017-10-16
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G01S5/20
Abstract: 本发明实施例提供了一种声源定位方法、系统、计算机设备及存储介质,其中,声源定位方法包括:获取声音传感器阵列中属于第一传感器对和第二传感器对的各声音传感器接收到的声音信号;根据第一传感器对中各声音传感器分别接收到的声音信号,分别计算各预先划分的区域对应的第一传播功率;根据第二传感器对中各声音传感器分别接收到的声音信号,分别计算各预先划分的区域对应的第二传播功率;确定多个第一传播功率中的最大值对应的多个第一区域以及多个第二传播功率中的最大值对应的多个第二区域;定位多个第一区域与多个第二区域的重合区域的方向为声源的方向。通过本方案可以保证准确定位声源。
-
公开(公告)号:CN108965789A
公开(公告)日:2018-12-07
申请号:CN201710349350.2
申请日:2017-05-17
Applicant: 杭州海康威视数字技术股份有限公司
IPC: H04N7/18
Abstract: 本发明实施例提供了一种无人机监测方法及音视频联动装置,其中,无人机监测方法包括:通过音频采集阵列采集声音信号;对声音信号进行信号处理,获得声音信号中至少一个信号特征满足预设条件的声音分量;确定信号特征满足预设条件的声音分量对应的目标物体所在位置;控制摄像头对准目标物体所在位置;根据摄像头拍摄到的图像,判断目标物体是否为无人机。通过本方案可以实现对无人机的监控,从而保证社会及个人安全。
-
公开(公告)号:CN108063890A
公开(公告)日:2018-05-22
申请号:CN201610986171.5
申请日:2016-11-09
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本发明实施例提供了一种监控设备控制方法及装置,该方法中,接收麦克风阵列采集的声源的声音信号;确定所述声音信号在所述麦克风阵列的中心处的声强信息;根据所述声强信息,确定所述声音信号对应的声源的方位角;将所述声源的方位角发送至所述监控设备的电机,以使所述电机带动摄像头转动至朝向所述声源。由于本发明实施例中通过声强信息来确定声源的方位角,而并非通过时延来确定方位角,因此能够提高小型监控设备的声源定位结果的准确性。
-
公开(公告)号:CN107976651A
公开(公告)日:2018-05-01
申请号:CN201610917562.1
申请日:2016-10-21
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G01S5/20 , G10L21/0208 , G10L21/0216
CPC classification number: G10L21/0208 , G01S5/20 , G10L21/0216 , G10L2021/02166
Abstract: 本发明实施例公开了一种基于麦克风阵列的声源定位方法及装置,所述方法包括:获取经所述麦克风阵列传输的语音信号,对所述语音信号进行分帧处理,并确定目标语音信号;确定所述目标语音信号中的目标频率点,并根据所述目标频率点,针对所述麦克风阵列中的预设位置,分别确定各预设位置的声压信号;根据所述各预设位置的声压信号和预设方位角,计算各预设方位角对应的波束响应值,并基于所述各预设方位角对应的波束响应值,确定声源方位角。由于声压信号具有一定指向性,因此采用预设位置的声压信号计算波束响应值,进而确定声源的方位角,可以在麦克风阵列尺寸较小的微型阵列条件下准确地定位声源的方位。
-
-
-
-
-
-
-
-
-