-
公开(公告)号:CN112820322B
公开(公告)日:2022-12-23
申请号:CN202110290710.2
申请日:2021-03-18
Applicant: 中国科学院声学研究所
Abstract: 本发明提出一种基于自监督对比学习的半监督音频事件标注方法,包括:提取无标注数据的梅尔对数能量谱特征,并对其做归一化;对每个频谱特征做两次随机增强生成两个特征;搭建自监督网络的编码器和投影层;计算样本输出间的相似度,通过排序确定正负样本;通过加强正负样本的对比训练网络;提取标注数据的梅尔对数能量谱特征,并对其做归一化;在训练好的编码器上加入新的分类器联合再训练;输出音频事件标注结果。本发明通过利用自监督对比学习,利用数据自身特点实现对无标注数据的监督学习,获得有效音频表征,然后利用少量标注数据再训练后生成音频中出现的事件类别。
-
公开(公告)号:CN113724740B
公开(公告)日:2024-03-08
申请号:CN202111005905.4
申请日:2021-08-30
Applicant: 中国科学院声学研究所
IPC: G10L25/78 , G06N3/0464 , G06N3/08 , G06N3/0455
-
公开(公告)号:CN113724740A
公开(公告)日:2021-11-30
申请号:CN202111005905.4
申请日:2021-08-30
Applicant: 中国科学院声学研究所
Abstract: 本发明涉及音频检测技术领域,提供了一种音频事件检测模型训练方法及装置,方法包括:对大师模型、教师模型、学生模型进行多次迭代,将满足迭代结束条件的学生模型作为音频事件检测模型;其中,在每次迭代中,对大师和教师模型的输出动态校正,为无标注数据生成伪标签;利用音频事件标签、大师模型的输出、老师模型的输出,迭代教师模型;根据教师模型参数更新大师模型的参数;用音频事件标签和伪标签迭代学生模型。本实施例的技术方案,通过大师模型和教师模型的模型参数的循环提升以及大师模型的输出对教师模型的输出的动态校正,可以提高无标注样本的利用效率,提升伪标签的正确率,从而提升音频事件检测的准确性。
-
公开(公告)号:CN112820322A
公开(公告)日:2021-05-18
申请号:CN202110290710.2
申请日:2021-03-18
Applicant: 中国科学院声学研究所
Abstract: 本发明提出一种基于自监督对比学习的半监督音频事件标注方法,包括:提取无标注数据的梅尔对数能量谱特征,并对其做归一化;对每个频谱特征做两次随机增强生成两个特征;搭建自监督网络的编码器和投影层;计算样本输出间的相似度,通过排序确定正负样本;通过加强正负样本的对比训练网络;提取标注数据的梅尔对数能量谱特征,并对其做归一化;在训练好的编码器上加入新的分类器联合再训练;输出音频事件标注结果。本发明通过利用自监督对比学习,利用数据自身特点实现对无标注数据的监督学习,获得有效音频表征,然后利用少量标注数据再训练后生成音频中出现的事件类别。
-
-
-