提示音检测方法、装置、设备及可读存储介质

    公开(公告)号:CN118230766A

    公开(公告)日:2024-06-21

    申请号:CN202410548135.5

    申请日:2024-05-06

    Abstract: 本申请公开了一种提示音检测方法、装置、设备及可读存储介质,本方案中,在获取待进行提示音检测的语音之后,从语音中确定至少一个待检测语音片段,每个待检测语音片段对应一个说话对象。根据各个待检测语音片段与预设的待检测提示音的声纹相似度,确定各个待检测语音片段是否为待检测提示音,如果确定待检测语音片段为待检测提示音,则说明待检测的语音中含有待检测提示音,待检测语音片段在所述语音中的位置即为待检测提示音在所述语音中的位置,进而得到提示音检测结果。本方案的提示音检测效率,相对于人工检测,得到了有效提升。并且,本档案的提示音检测方案,支持多种提示音的检测,通用性较强。

    离线个性化声纹学习方法及说话人分离方法

    公开(公告)号:CN119785801A

    公开(公告)日:2025-04-08

    申请号:CN202411754107.5

    申请日:2024-12-02

    Abstract: 本发明提供一种离线个性化声纹学习方法及说话人分离方法,涉及语音处理技术领域,在设备端确定内置的通用声纹识别模型和目标通用声纹学习数据,并获取个性化声纹学习数据;利用训练数据和个性化声纹学习数据,对通用声纹识别模型进行元学习,得到初始个性化声纹识别模型;最后利用测试数据,分别对通用声纹识别模型和初始个性化声纹识别模型进行测试,并基于得到的第一测试结果,确定目标个性化声纹识别模型。该方法利用个性化声纹学习数据以及设备端内置的训练数据,对通用声纹识别模型进行元学习以及测试即可实现离线个性化训练,不需要向每个设备端传输模型更新包,可以大大提高模型更新效率,降低成本,避免因更新包传输引入的安全性问题。

Patent Agency Ranking