-
公开(公告)号:CN114333898A
公开(公告)日:2022-04-12
申请号:CN202111506116.9
申请日:2021-12-10
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种声音事件检测方法、设备、系统和可读存储介质,该方法应用于检测设备,该方法包括:接收正样本数据,正样本数据为与目标应用场景中发生的目标声音事件相关的音频数据;对目标应用场景中的声音进行收集,得到负样本数据;将正样本数据与负样本数据发送至云端设备,以使得云端设备基于正样本数据与负样本数据对声音事件检测模型进行训练得到第一声音事件检测模型;获取目标应用场景中的实时音频数据,并采用第一声音事件检测模型对实时音频数据进行检测,得到当前检测结果,当前检测结果为目标应用场景是否发生目标声音事件的检测结果。通过上述方式,本申请能够提升检测效果,用户能够自定义声音事件检测模型的检测类型。
-
公开(公告)号:CN113448975B
公开(公告)日:2023-01-17
申请号:CN202110578744.1
申请日:2021-05-26
Applicant: 科大讯飞股份有限公司
IPC: G06F16/23 , G06V10/762 , G06V10/82 , G06N3/04 , G06N3/08
Abstract: 本申请公开了一种人物画像库的更新方法、装置、系统和存储介质,该方法包括:对获取到的语音序列进行特征提取处理,得到新声纹特征;判断新声纹特征与人物画像库中的声纹特征是否匹配;若匹配失败,则基于当前匹配失败的次数判定是否满足第一聚类触发条件;若满足第一聚类触发条件,则对新声纹特征进行聚类处理,得到第一聚类结果,基于第一聚类结果将新声纹特征注册到人物画像库中。通过上述方式,本申请能够实现自动将新说话人的信息注册到人物画像库,且保护用户的隐私。
-
公开(公告)号:CN113448975A
公开(公告)日:2021-09-28
申请号:CN202110578744.1
申请日:2021-05-26
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种人物画像库的更新方法、装置、系统和存储介质,该方法包括:对获取到的语音序列进行特征提取处理,得到新声纹特征;判断新声纹特征与人物画像库中的声纹特征是否匹配;若匹配失败,则基于当前匹配失败的次数判定是否满足第一聚类触发条件;若满足第一聚类触发条件,则对新声纹特征进行聚类处理,得到第一聚类结果,基于第一聚类结果将新声纹特征注册到人物画像库中。通过上述方式,本申请能够实现自动将新说话人的信息注册到人物画像库,且保护用户的隐私。
-
公开(公告)号:CN118230766A
公开(公告)日:2024-06-21
申请号:CN202410548135.5
申请日:2024-05-06
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种提示音检测方法、装置、设备及可读存储介质,本方案中,在获取待进行提示音检测的语音之后,从语音中确定至少一个待检测语音片段,每个待检测语音片段对应一个说话对象。根据各个待检测语音片段与预设的待检测提示音的声纹相似度,确定各个待检测语音片段是否为待检测提示音,如果确定待检测语音片段为待检测提示音,则说明待检测的语音中含有待检测提示音,待检测语音片段在所述语音中的位置即为待检测提示音在所述语音中的位置,进而得到提示音检测结果。本方案的提示音检测效率,相对于人工检测,得到了有效提升。并且,本档案的提示音检测方案,支持多种提示音的检测,通用性较强。
-
-
-