-
公开(公告)号:CN114386518A
公开(公告)日:2022-04-22
申请号:CN202210039999.5
申请日:2022-01-14
Applicant: 桂林电子科技大学
Abstract: 本发明公开了基于自适应宽度自注意力机制的轻量化异常声事件检测方法,该方法首先把带标签的音频进行信号处理得到它的某种时频特征表示;其次,把带标签的特征表示(通常是向量或矩阵)当作输入,给自适应宽度自注意力机制模型,然后,自适应宽度自注意力机制模型中有定义好的损失函数和随机初始化注意力权重,根据自适应自注意力机制算法算出和标签的损失值,接下来用反向传播算法,更新自适应注意力权重,通过对注意力三个输入权重持续进行更新迭代,直到损失函数达到最小或理想状态。最后,使用轻量化的方法保存此时的权重参数,接下来以此权重参数为模型对一段未标注的音频做预测,快速准确的对发生的异常声事件。
-
公开(公告)号:CN113140226B
公开(公告)日:2022-06-21
申请号:CN202110465526.7
申请日:2021-04-28
Applicant: 桂林电子科技大学
Abstract: 本发明公开了一种采用双Token标签的声事件标注及识别方法,其特征在于,包括声事件标注过程和识别过程,所述声事件标注过程为:1‑1)音频标签形式;1‑2)完成数据集中所有音频标注;所述识别过程为:2‑1)构建音频数据集;2‑2)音频数据预处理和特征提取;2‑3)音频数据扩增;2‑4)搭建卷积循环神经网络;2‑5)训练卷积循环神经网络学习检测模型;2‑6)使用训练好的检测模型识别待检测音频。这种方法能在保证准确率的同时,以较小的代价拓宽声事件识别范围,可实现人们生活环境中准确的声音事件检测与监控,从而更好地服务智慧城市建设。
-
公开(公告)号:CN113140226A
公开(公告)日:2021-07-20
申请号:CN202110465526.7
申请日:2021-04-28
Applicant: 桂林电子科技大学
Abstract: 本发明公开了一种采用双Token标签的声事件标注及识别方法,其特征在于,包括声事件标注过程和识别过程,所述声事件标注过程为:1‑1)音频标签形式;1‑2)完成数据集中所有音频标注;所述识别过程为:2‑1)构建音频数据集;2‑2)音频数据预处理和特征提取;2‑3)音频数据扩增;2‑4)搭建卷积循环神经网络;2‑5)训练卷积循环神经网络学习检测模型;2‑6)使用训练好的检测模型识别待检测音频。这种方法能在保证准确率的同时,以较小的代价拓宽声事件识别范围,可实现人们生活环境中准确的声音事件检测与监控,从而更好地服务智慧城市建设。
-
-