-
公开(公告)号:CN114386518A
公开(公告)日:2022-04-22
申请号:CN202210039999.5
申请日:2022-01-14
Applicant: 桂林电子科技大学
Abstract: 本发明公开了基于自适应宽度自注意力机制的轻量化异常声事件检测方法,该方法首先把带标签的音频进行信号处理得到它的某种时频特征表示;其次,把带标签的特征表示(通常是向量或矩阵)当作输入,给自适应宽度自注意力机制模型,然后,自适应宽度自注意力机制模型中有定义好的损失函数和随机初始化注意力权重,根据自适应自注意力机制算法算出和标签的损失值,接下来用反向传播算法,更新自适应注意力权重,通过对注意力三个输入权重持续进行更新迭代,直到损失函数达到最小或理想状态。最后,使用轻量化的方法保存此时的权重参数,接下来以此权重参数为模型对一段未标注的音频做预测,快速准确的对发生的异常声事件。
-
公开(公告)号:CN118675542A
公开(公告)日:2024-09-20
申请号:CN202310247175.1
申请日:2023-03-15
Applicant: 桂林电子科技大学
IPC: G10L21/0272 , G10L25/30
Abstract: 本发明公开了一种混响环境下基于注意力加权的多通道语音分离方法,首先,利用多通道麦克风阵列收集混合语言;其次,对各个麦克风收集到的语音进行快速傅里叶变换得到混合语音信号时频谱,分别取各个通道语音信号的频域相位信息获得通道间相位差特征;然后引入自注意力机制的思想,采用打分加权的方式,对多组通道间相位差进行特征融合,与其它形式的特征拼接组成输入特征;最后将输入特征送入当下流行的时域卷积网络系统模型中迭代训练,得到语音分离模型。该方法采用加权打分的方式,解决了麦克风通道浪费的问题,尽可能多的使用通道间相位差,减少了语音信号空间信息的损失,使得语音分离性能得到了提升。
-