-
公开(公告)号:CN119360029A
公开(公告)日:2025-01-24
申请号:CN202411896769.6
申请日:2024-12-23
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G06V10/26 , G06V10/82 , G06N3/0455 , G06N3/098 , G06V10/44
Abstract: 本申请公开了一种图像分割方法、装置、存储介质和电子设备,方法包括:获取至少一个参考图像和所述参考图像的掩模图;将所述参考图像和所述参考图像的掩模图输入第一神经网络进行处理,得到用于指示所述视觉内容分类信息的参考分类特征和用于指示所述视觉内容在图像中各个位置上的特征信息的参考图像特征;将查询图像、所述参考分类特征和所述参考图像特征输入第二神经网络,在所述参考图像特征的引导下,对所述查询图像进行目标分割得到至少一个目标分割结果,并基于所述参考分类特征确定各个目标分割结果的置信度;基于所述置信度,确定图像分割的最终分割结果进行输出。应用本申请,能够基于用户需求进行图像分割,并有效提升系统性能。
-
公开(公告)号:CN108062959B
公开(公告)日:2021-04-02
申请号:CN201610979542.7
申请日:2016-11-08
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G10L21/0208 , G10L21/0264
Abstract: 本申请实施例提供了一种声音降噪方法及装置,涉及音频处理技术领域。所述方法包括:获取当前采样点的第一声音数据;获取第二声音数据,其中,第二声音数据为第二采样时刻采集的数据,第二采样时刻为第一采样时刻之前、与第一采样时刻最接近的预设数量个采样时刻,第一采样时刻为第一声音数据对应的采样时刻;根据第二声音数据,对第一声音数据进行滑动平滑处理;将处理后的采样数据,确定为所述第一声音数据降噪后的数据。应用本实施例的技术方案,能够从声音信号中去除突变型噪声,提高声音的品质。
-
公开(公告)号:CN111798864A
公开(公告)日:2020-10-20
申请号:CN202010633748.0
申请日:2020-07-02
Applicant: 杭州海康威视数字技术股份有限公司
Inventor: 杨茜
IPC: G10L21/0208 , G10L21/0232
Abstract: 本申请实施例提供的一种回声消除方法、装置、电子设备及存储介质,可以获取扬声器播放的信号;根据预先计算得到的频率响应曲线对扬声器播放的信号进行预滤波处理,得到参考信号;根据参考信号及预先获取的拾音器采集到的信号,进行回声信号的拟合,得到模拟回声信号;根据模拟回声信号对拾音器采集的信号进行回声信号的消除。通过预滤波的扬声器信号和拾音器采集到的信号,进行当前回声信号的拟合,消除拾音器采集到的信号中回声成分,从而提高回声信号消除的准确率和效率。
-
公开(公告)号:CN109427345A
公开(公告)日:2019-03-05
申请号:CN201710754716.4
申请日:2017-08-29
Applicant: 杭州海康威视数字技术股份有限公司
Inventor: 杨茜
IPC: G10L25/51 , G10L25/18 , G10L25/21 , G10L21/0232 , G10L21/0316
Abstract: 本发明实施例提供了一种风噪检测方法、装置及系统,方法包括:将每一帧音频数据转换为频域数据,根据频域数据的频谱质心,确定音频数据中是否存在风噪;可见,第一方面,利用一路音频数据即可进行风噪检测,不需要同时采集两路音频数据进行对比,操作方便;第二方面,相比于设置两台采集设备以采集两路音频数据的方案,本方案仅需要一台采集设备采集一路音频数据即可,降低了设备成本。
-
公开(公告)号:CN108074580A
公开(公告)日:2018-05-25
申请号:CN201611023704.6
申请日:2016-11-17
Applicant: 杭州海康威视数字技术股份有限公司
Inventor: 杨茜
IPC: G10L21/0208 , G10L21/0232 , G10L21/0272
Abstract: 本发明实施例提供了一种噪声消除方法及装置,应用于音频降噪技术领域,所述方法包括:对接收信号进行预处理,得到所述接收信号在频域上不同频点的第一频域信号;根据独立成分分析算法对所述第一频域信号进行盲源分离,得到不同频点的频域语音信号和不同频点的频域噪声信号;将所述频域语音信号从频域转换至时域,根据转换结果获得对所述接收信号消除噪声后的语音信号。本发明与现有的噪声消除方法相比,不需要对两个麦克风之间的距离进行限制,直接将噪声消除。
-
公开(公告)号:CN107919134A
公开(公告)日:2018-04-17
申请号:CN201610883702.8
申请日:2016-10-10
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G10L21/0208 , G10L21/0232 , G10L21/0264 , G10L25/21 , H04R3/04
CPC classification number: G10L21/0208 , G10L21/0232 , G10L21/0264 , G10L25/21 , H04R3/04
Abstract: 本发明实施例提供啸叫检测方法及装置和啸叫抑制方法及装置,该啸叫检测方法包括:获得待检测音频帧在频域空间内的候选频率点;确定每个候选频率点各自对应的至少一个参考频率点;计算每个候选频率点与其对应的各个参考频率点之间的功率比值;基于相对应的功率比值,分别判断每个候选频率点是否为啸叫频率点;当判断结果表明存在啸叫频率点时确定待检测音频产生啸叫。应用本发明实施例提供的方案进行啸叫检测时,能够针对每一候选频率点确定至少一个与其对应的参考频率点,然后计算每个候选频率点与其对应的各个参考频率点的功率比值,避免了采用平均功率进行比较时导致的将低频部分的正常频率点误判为啸叫频率点的问题,提高了啸叫检测的准确率。
-
公开(公告)号:CN111798864B
公开(公告)日:2024-06-04
申请号:CN202010633748.0
申请日:2020-07-02
Applicant: 杭州海康威视数字技术股份有限公司
Inventor: 杨茜
IPC: G10L21/0208 , G10L21/0232
Abstract: 本申请实施例提供的一种回声消除方法、装置、电子设备及存储介质,可以获取扬声器播放的信号;根据预先计算得到的频率响应曲线对扬声器播放的信号进行预滤波处理,得到参考信号;根据参考信号及预先获取的拾音器采集到的信号,进行回声信号的拟合,得到模拟回声信号;根据模拟回声信号对拾音器采集的信号进行回声信号的消除。通过预滤波的扬声器信号和拾音器采集到的信号,进行当前回声信号的拟合,消除拾音器采集到的信号中回声成分,从而提高回声信号消除的准确率和效率。
-
公开(公告)号:CN109285557B
公开(公告)日:2022-11-01
申请号:CN201710592299.8
申请日:2017-07-19
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G10L21/028 , G10L21/0216
Abstract: 本发明实施例提供了一种定向拾音方法、装置及电子设备,方法为:对两个麦克风采集的两路初始语音信号分别进行分帧处理;针对每一帧对应的两路初始语音信号分别进行频域转换,得到该帧对应的两路频域信号;再计算该帧的初始分离矩阵;基于预设的拾音方向相对于两个麦克风的角度,对每一帧的初始分离矩阵进行排序修正,得到该帧的目标分离矩阵;根据每一帧的目标分离矩阵,从该帧对应的两路初始语音信号中分离出目标语音信号在该帧对应的频域信号,目标语音信号为定向角度上的语音信号;分别对目标语音信号在每一帧对应的频域信号进行时域转换,得到目标语音信号。应用本发明实施例的方案可以减小定向拾音设备的尺寸。
-
公开(公告)号:CN108062959A
公开(公告)日:2018-05-22
申请号:CN201610979542.7
申请日:2016-11-08
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G10L21/0208 , G10L21/0264
Abstract: 本申请实施例提供了一种声音降噪方法及装置,涉及音频处理技术领域。所述方法包括:获取当前采样点的第一声音数据;获取第二声音数据,其中,第二声音数据为第二采样时刻采集的数据,第二采样时刻为第一采样时刻之前、与第一采样时刻最接近的预设数量个采样时刻,第一采样时刻为第一声音数据对应的采样时刻;根据第二声音数据,对第一声音数据进行滑动平滑处理;将处理后的采样数据,确定为所述第一声音数据降噪后的数据。应用本实施例的技术方案,能够从声音信号中去除突变型噪声,提高声音的品质。
-
公开(公告)号:CN112911465B
公开(公告)日:2022-09-02
申请号:CN202110138609.5
申请日:2021-02-01
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本发明实施例提供了信号发送方法、装置及电子设备,该方法包括:获取语音信号,其中,语音信号是针对交互现场进行语音采集的麦克风阵列所采集的;基于预设的波束形成算法,对所获取的语音信号进行波束生成,得到多个波束方向不同的语音波束;获取远端音源信息,其中,远端音源信息用于指示交互现场中远端音源相对麦克风阵列的方向;从多个语音波束中,确定波束方向与远端音源信息所指示方向不同的语音波束,作为可用波束。通过本方案,可以提高语音交互系统的互动质量。
-
-
-
-
-
-
-
-
-