一种高召回率弱标注声音事件检测方法

发明授权

CN112036477B 一种高召回率弱标注声音事件检测方法有权

请登陆查看更多内容

专利标题： 一种高召回率弱标注声音事件检测方法
申请号： CN202010889143.8

申请日： 2020-08-28
公开(公告)号： CN112036477B

公开(公告)日： 2022-06-17
发明人: 李青轩 , 杨毅 , 孙甲松
申请人： 清华大学
申请人地址： 北京市海淀区100084信箱82分箱清华大学专利办公室
专利权人： 清华大学
当前专利权人： 清华大学
当前专利权人地址： 北京市海淀区100084信箱82分箱清华大学专利办公室
代理机构： 西安智大知识产权代理事务所
代理商 段俊涛
主分类号： G06K9/62
IPC分类号： G06K9/62 ; G06N3/04 ; G06N3/08

摘要：

一种高召回率弱标注声音事件检测方法，设定深度学习对应的神经网络、训练数据；初始化损失函数为交叉熵损失，并增加若干组不同权重的骰子损失，其中正样本占比越高，需要权重越大；训练并测试观察仅用交叉熵损失和增加若干组不同权重骰子损失的实验结果好坏；调整损失中的权重超参数，重新进行若干组骰子损失权重取值；循环迭代找出最好的效果完成训练，得到最终的损失函数；将最终的损失函数用于神经网络检测模型，将所得模型应用至声音事件检测系统，通过神经网络分类器得到声音事件的包级预测和帧级预测。本发明可解决声音事件检测中普遍采用的一对多实现多分类从而导致样本分布不均的问题，有效提升更重视召回率的F2分数。

公开/授权文献

CN112036477A 一种高召回率弱标注声音事件检测方法公开/授权日：2020-12-04

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G06	计算；推算或计数
G06K	图形数据读取（图像或视频识别或理解G06V）；数据的呈现；记录载体；处理记录载体
G06K9/00	识别模式的方法或装置（图形读取或将机械参数模式（例如力或存在）转换为电信号的方法或装置 G06K11/00）（图像或视频识别或理解 G06V）（语音识别 G10L15/00 )
G06K9/62	.应用电子设备进行识别的方法或装置