-
公开(公告)号:CN116110407A
公开(公告)日:2023-05-12
申请号:CN202211590817.X
申请日:2022-12-12
Applicant: 天津市国瑞数码安全系统股份有限公司
Abstract: 本发明涉及娇喘音频检测领域,尤其涉及一种基于融合技术的娇喘音频检测方法,包括:利用待检测音频进行初始化处理得到待检测初始化音频;利用所述待检测初始化音频获取待检测初始化音频语谱特征;利用所述待检测初始化音频语谱特征得到娇喘音频检测结果,在娇喘音频中加入对音频种类的判断,通过分类器一过滤掉一部分不属于人声的音频,并把语音种类信息特征融入娇喘音频分类特征中,提高娇喘音频识别的准确率。
-
公开(公告)号:CN118675548A
公开(公告)日:2024-09-20
申请号:CN202410752873.1
申请日:2024-06-12
Applicant: 天津市国瑞数码安全系统股份有限公司
Abstract: 本发明提供一种基于强弱监督的多模态检测方法和系统,能够在不损失识别精度的条件下,通过构建一种强监督和弱监督的两种条件架构来进行音频‑视频多模态融合检测,以此实现面向深度虚假音视频的检测,克服现有检测方法多侧重于单一模态的数据,很难全面检测包含不同模态的数据,以及现有在弱监督条件下的检测方法检测性能表现不佳的问题。
-