-
公开(公告)号:CN119146373B
公开(公告)日:2025-02-11
申请号:CN202411613790.0
申请日:2024-11-13
Applicant: 杭州海康威视数字技术股份有限公司
Inventor: 董勤波
Abstract: 本申请实施例提供了一种气体泄漏量确定方法、泄漏量确定模型的训练方法及装置,电子设备可以获取环境信息以及声音信号;将声音信号和环境信息输入泄漏量确定模型,以使泄漏量确定模型基于声音信号以及环境信息确定融合信息,并从融合信息中将噪声特征去除,得到泄漏量特征,并根据泄漏量特征以及环境信息确定气体泄漏量。由于样本对包括的两组样本是在相同环境噪声下采集的,因此两组样本对应的样本噪声特征的差异较小。通过引入噪声对比损失,按照使得噪声对比损失减小的方向调节初始泄漏量确定模型的参数,可以使得训练完成的泄漏量确定模型准确提取环境噪声,准确地去除融合信息包含的噪声特征,进而提高气体泄漏量确定的准确度。
-
公开(公告)号:CN112992127B
公开(公告)日:2024-05-07
申请号:CN201911275670.3
申请日:2019-12-12
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本申请公开了一种语音识别的方法,属于语音识别领域。所述方法包括:接收终端发送的语音识别请求,其中,所述语音识别请求中携带有待识别语音数据和对应的第一领域标识;基于所述第一领域标识,以及预先存储的领域标识和领域语音识别模型的对应关系,确定用于识别所述待识别语音数据的领域语音识别模型;基于所述用于识别所述待识别语音数据的领域语音识别模型,确定所述待识别语音数据对应的结果文本数据;向所述终端发送所述结果文本数据。通过本申请可以提供语音识别的准确性。
-
公开(公告)号:CN119146373A
公开(公告)日:2024-12-17
申请号:CN202411613790.0
申请日:2024-11-13
Applicant: 杭州海康威视数字技术股份有限公司
Inventor: 董勤波
Abstract: 本申请实施例提供了一种气体泄漏量确定方法、泄漏量确定模型的训练方法及装置,电子设备可以获取环境信息以及声音信号;将声音信号和环境信息输入泄漏量确定模型,以使泄漏量确定模型基于声音信号以及环境信息确定融合信息,并从融合信息中将噪声特征去除,得到泄漏量特征,并根据泄漏量特征以及环境信息确定气体泄漏量。由于样本对包括的两组样本是在相同环境噪声下采集的,因此两组样本对应的样本噪声特征的差异较小。通过引入噪声对比损失,按照使得噪声对比损失减小的方向调节初始泄漏量确定模型的参数,可以使得训练完成的泄漏量确定模型准确提取环境噪声,准确地去除融合信息包含的噪声特征,进而提高气体泄漏量确定的准确度。
-
公开(公告)号:CN115440245A
公开(公告)日:2022-12-06
申请号:CN202211031221.6
申请日:2022-08-26
Applicant: 杭州海康威视数字技术股份有限公司
Inventor: 董勤波
Abstract: 本申请实施例公开了一种声音识别方法、装置、设备及存储介质,属于计算机技术领域。该方法的执行主体为计算机设备,该方法包括:获取第一传感器采集目标对象的第一声音特征信息;将第一声音特征信息输入概率密度估计模型,输出第一声音特征信息存在异常声音的第一概率值;在第一概率值符合预设概率条件的情况下,获取第二传感器采集目标对象的第二声音特征信息;根据第一声音特征信息和第二声音特征信息生成目标组合特征信息;将目标组合特征信息输入相关度计算模型,输出相关度;在相关度符合预设相关度条件的情况下,确定目标对象发出异常声音,基于该声音识别模型进行声音识别,可以提高声音识别精度。
-
公开(公告)号:CN116013362A
公开(公告)日:2023-04-25
申请号:CN202211582372.0
申请日:2022-12-09
Applicant: 杭州海康威视数字技术股份有限公司
Inventor: 董勤波
Abstract: 本申请实施例提供一种故障类型的确定方法、装置、计算机设备及可读存储介质,涉及故障声纹监测技术领域。该方法包括:确定同一类型的不同设备的样本声纹向量之间的相似度;根据相似度将同一类型的不同设备,划分为多个子类型;获取同一类型的不同设备中目标设备的设备声纹向量;若确定目标设备的设备声纹向量为故障声纹向量,则根据目标故障样本库中的对应关系,确定目标设备的故障类型。本申请实施例提供的方法,先通过同一类型的不同设备的样本声纹向量之间的相似度,将同一类型的设备分类,分类后的设备共享故障样本库,可以降低不同设备之间的差异对确定故障类型过程的影响,进而提升确定设备故障类型的准确性。
-
公开(公告)号:CN111862991A
公开(公告)日:2020-10-30
申请号:CN201910362576.5
申请日:2019-04-30
Applicant: 杭州海康威视数字技术股份有限公司
Inventor: 董勤波
Abstract: 本发明公开了一种婴儿哭声的识别方法及系统,本发明实施例在识别婴儿哭声时基于声纹识别技术,采用声纹识别技术对从采集的婴儿哭声的提取特征进行声纹识别,确认该婴儿哭声对应的婴儿年龄;再根据婴儿年龄输入到对应的针对不同婴儿年龄建立的哭声类别识别神经网络模型中,得到该婴儿哭声对应的婴儿哭声类别,从而确认婴儿哭声的具体含义,以确定婴儿对应的各种状况。由于本发明实施例在识别婴儿哭声过程中,采用了相结合的声纹识别技术及神经网络技术,所以识别的准确度及精确度比较高,简单且易于执行。
-
公开(公告)号:CN116866786A
公开(公告)日:2023-10-10
申请号:CN202310945653.6
申请日:2023-07-28
Applicant: 杭州海康威视数字技术股份有限公司
Inventor: 董勤波
IPC: H04R3/12
Abstract: 本申请公开了一种麦克风阵列选择方法、装置、设备及存储介质,所述麦克风阵列选择方法包括:获取麦克风阵列中各麦克风的阵列麦数据;将所述阵列麦数据输入至预设的阵列麦预测模型,基于所述阵列麦预测模型,对所述阵列麦数据进行阵列选择处理,得到目标阵列麦,其中,所述阵列麦预测模型是基于目标阵列麦样本数据和所述目标阵列麦样本数据对应的阵列麦选择标签,对预设的待训练预测模型进行迭代训练得到的;基于所述目标阵列麦对应的阵列麦数据,确定声源定位信息。本申请属于声音信号处理技术领域,基于预训练完成的阵列麦预测模型,对各麦克风的阵列麦数据进行阵列选择处理,仅选择部分阵列麦进行声源定位,以此降低设备功耗。
-
公开(公告)号:CN110837758B
公开(公告)日:2023-06-02
申请号:CN201810939640.7
申请日:2018-08-17
Applicant: 杭州海康威视数字技术股份有限公司
Inventor: 董勤波
Abstract: 本发明实施例提供了一种关键词输入方法、装置及电子设备。方法包括:获取用户输入的音频信号,以及用户输入音频信号期间采集的视频信号,视频信号包括唇部视频图像;对音频信号进行关键词识别,得到第一关键词以及第一关键词的置信度;对唇部视频图像进行唇语识别,得到第二关键词以及第二关键词的置信度;根据相对质量与第一关键词的置信度,确定第一关键词的加权置信度,以及根据相对质量与第二关键词的置信度,确定第二关键词的加权置信度,相对质量用于表示音频信号的信号质量相对于视频信号的信号质量的优劣程度;将第一关键词和第二关键词中加权置信度较大的关键词,作为输入的关键词。可以有效提高关键词输入的准确度。
-
公开(公告)号:CN112116909A
公开(公告)日:2020-12-22
申请号:CN201910538919.9
申请日:2019-06-20
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本申请实施例提供一种语音识别方法、装置及系统。本申请实施例通过根据待识别的目标语音信号对应的目标区域标识,确定与目标区域标识对应的目标语音识别引擎,利用目标语音识别引擎,对目标语音信号进行识别,得到识别结果,能够根据区域标识准确确定对应的语音识别引擎,并基于确定的语音识别引擎获得准确的语音识别结果,提高了语音识别的准确性。
-
公开(公告)号:CN112992127A
公开(公告)日:2021-06-18
申请号:CN201911275670.3
申请日:2019-12-12
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本申请公开了一种语音识别的方法,属于语音识别领域。所述方法包括:接收终端发送的语音识别请求,其中,所述语音识别请求中携带有待识别语音数据和对应的第一领域标识;基于所述第一领域标识,以及预先存储的领域标识和领域语音识别模型的对应关系,确定用于识别所述待识别语音数据的领域语音识别模型;基于所述用于识别所述待识别语音数据的领域语音识别模型,确定所述待识别语音数据对应的结果文本数据;向所述终端发送所述结果文本数据。通过本申请可以提供语音识别的准确性。
-
-
-
-
-
-
-
-
-