-
公开(公告)号:CN107919134B
公开(公告)日:2021-04-02
申请号:CN201610883702.8
申请日:2016-10-10
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G10L21/0208 , G10L21/0232 , G10L21/0264 , G10L25/21 , H04R3/04
Abstract: 本发明实施例提供啸叫检测方法及装置和啸叫抑制方法及装置,该啸叫检测方法包括:获得待检测音频帧在频域空间内的候选频率点;确定每个候选频率点各自对应的至少一个参考频率点;计算每个候选频率点与其对应的各个参考频率点之间的功率比值;基于相对应的功率比值,分别判断每个候选频率点是否为啸叫频率点;当判断结果表明存在啸叫频率点时确定待检测音频产生啸叫。应用本发明实施例提供的方案进行啸叫检测时,能够针对每一候选频率点确定至少一个与其对应的参考频率点,然后计算每个候选频率点与其对应的各个参考频率点的功率比值,避免了采用平均功率进行比较时导致的将低频部分的正常频率点误判为啸叫频率点的问题,提高了啸叫检测的准确率。
-
公开(公告)号:CN111145753A
公开(公告)日:2020-05-12
申请号:CN201811302321.1
申请日:2018-11-02
Applicant: 杭州海康威视数字技术股份有限公司
Inventor: 杨茜
IPC: G10L15/26 , G10L21/0216
Abstract: 本申请实施例提供了一种语音处理方法、装置及系统,方法包括:对语音数据进行声源定位,基于定位结果,对语音数据转化的文字数据进行标记;也就是通过不同人员的位置,区分不同人员发表的内容,并且计算量不大。
-
公开(公告)号:CN119360029B
公开(公告)日:2025-04-11
申请号:CN202411896769.6
申请日:2024-12-23
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G06V10/26 , G06V10/82 , G06N3/0455 , G06N3/098 , G06V10/44
Abstract: 本申请公开了一种图像分割方法、装置、存储介质和电子设备,方法包括:获取至少一个参考图像和所述参考图像的掩模图;将所述参考图像和所述参考图像的掩模图输入第一神经网络进行处理,得到用于指示所述视觉内容分类信息的参考分类特征和用于指示所述视觉内容在图像中各个位置上的特征信息的参考图像特征;将查询图像、所述参考分类特征和所述参考图像特征输入第二神经网络,在所述参考图像特征的引导下,对所述查询图像进行目标分割得到至少一个目标分割结果,并基于所述参考分类特征确定各个目标分割结果的置信度;基于所述置信度,确定图像分割的最终分割结果进行输出。应用本申请,能够基于用户需求进行图像分割,并有效提升系统性能。
-
公开(公告)号:CN112911465A
公开(公告)日:2021-06-04
申请号:CN202110138609.5
申请日:2021-02-01
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本发明实施例提供了信号发送方法、装置及电子设备,该方法包括:获取语音信号,其中,语音信号是针对交互现场进行语音采集的麦克风阵列所采集的;基于预设的波束形成算法,对所获取的语音信号进行波束生成,得到多个波束方向不同的语音波束;获取远端音源信息,其中,远端音源信息用于指示交互现场中远端音源相对麦克风阵列的方向;从多个语音波束中,确定波束方向与远端音源信息所指示方向不同的语音波束,作为可用波束。通过本方案,可以提高语音交互系统的互动质量。
-
公开(公告)号:CN109285557A
公开(公告)日:2019-01-29
申请号:CN201710592299.8
申请日:2017-07-19
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G10L21/028 , G10L21/0216
Abstract: 本发明实施例提供了一种定向拾音方法、装置及电子设备,方法为:对两个麦克风采集的两路初始语音信号分别进行分帧处理;针对每一帧对应的两路初始语音信号分别进行频域转换,得到该帧对应的两路频域信号;再计算该帧的初始分离矩阵;基于预设的拾音方向相对于两个麦克风的角度,对每一帧的初始分离矩阵进行排序修正,得到该帧的目标分离矩阵;根据每一帧的目标分离矩阵,从该帧对应的两路初始语音信号中分离出目标语音信号在该帧对应的频域信号,目标语音信号为定向角度上的语音信号;分别对目标语音信号在每一帧对应的频域信号进行时域转换,得到目标语音信号。应用本发明实施例的方案可以减小定向拾音设备的尺寸。
-
公开(公告)号:CN109427345B
公开(公告)日:2022-12-02
申请号:CN201710754716.4
申请日:2017-08-29
Applicant: 杭州海康威视数字技术股份有限公司
Inventor: 杨茜
IPC: G10L25/51 , G10L25/18 , G10L25/21 , G10L21/0232 , G10L21/0316
Abstract: 本发明实施例提供了一种风噪检测方法、装置及系统,方法包括:将每一帧音频数据转换为频域数据,根据频域数据的频谱质心,确定音频数据中是否存在风噪;可见,第一方面,利用一路音频数据即可进行风噪检测,不需要同时采集两路音频数据进行对比,操作方便;第二方面,相比于设置两台采集设备以采集两路音频数据的方案,本方案仅需要一台采集设备采集一路音频数据即可,降低了设备成本。
-
公开(公告)号:CN108074580B
公开(公告)日:2021-04-02
申请号:CN201611023704.6
申请日:2016-11-17
Applicant: 杭州海康威视数字技术股份有限公司
Inventor: 杨茜
IPC: G10L21/0208 , G10L21/0232 , G10L21/0272
Abstract: 本发明实施例提供了一种噪声消除方法及装置,应用于音频降噪技术领域,所述方法包括:对接收信号进行预处理,得到所述接收信号在频域上不同频点的第一频域信号;根据独立成分分析算法对所述第一频域信号进行盲源分离,得到不同频点的频域语音信号和不同频点的频域噪声信号;将所述频域语音信号从频域转换至时域,根据转换结果获得对所述接收信号消除噪声后的语音信号。本发明与现有的噪声消除方法相比,不需要对两个麦克风之间的距离进行限制,直接将噪声消除。
-
-
-
-
-
-