发明授权
- 专利标题: 一种高召回率弱标注声音事件检测方法
-
申请号: CN202010889143.8申请日: 2020-08-28
-
公开(公告)号: CN112036477B公开(公告)日: 2022-06-17
- 发明人: 李青轩 , 杨毅 , 孙甲松
- 申请人: 清华大学
- 申请人地址: 北京市海淀区100084信箱82分箱清华大学专利办公室
- 专利权人: 清华大学
- 当前专利权人: 清华大学
- 当前专利权人地址: 北京市海淀区100084信箱82分箱清华大学专利办公室
- 代理机构: 西安智大知识产权代理事务所
- 代理商 段俊涛
- 主分类号: G06K9/62
- IPC分类号: G06K9/62 ; G06N3/04 ; G06N3/08
摘要:
一种高召回率弱标注声音事件检测方法,设定深度学习对应的神经网络、训练数据;初始化损失函数为交叉熵损失,并增加若干组不同权重的骰子损失,其中正样本占比越高,需要权重越大;训练并测试观察仅用交叉熵损失和增加若干组不同权重骰子损失的实验结果好坏;调整损失中的权重超参数,重新进行若干组骰子损失权重取值;循环迭代找出最好的效果完成训练,得到最终的损失函数;将最终的损失函数用于神经网络检测模型,将所得模型应用至声音事件检测系统,通过神经网络分类器得到声音事件的包级预测和帧级预测。本发明可解决声音事件检测中普遍采用的一对多实现多分类从而导致样本分布不均的问题,有效提升更重视召回率的F2分数。
公开/授权文献
- CN112036477A 一种高召回率弱标注声音事件检测方法 公开/授权日:2020-12-04