-
公开(公告)号:CN117437937A
公开(公告)日:2024-01-23
申请号:CN202311527659.8
申请日:2023-11-16
Applicant: 南京邮电大学
Abstract: 本发明公开了基于时频谱遮蔽的待修复语音的判别与修复方法、系统,该方法包括对原始语音进行处理,并应用掩码分别形成初始训练集的对照数据和性能测试数据集;提取原始语音和对照数据的频谱特征,将时域信号转化为频域信息,分别保存为原始数据集和对照数据集并打标签;构建基于频谱信息的频谱自注意力神经网络模型提取浅层和深层频谱信息特征,通过跳跃链接层链接特征,添加全连接神经网络,得到语音被掩码概率值;构建基于频谱自注意力的卷积神经网络模型,根据损失值进行反向传播,调整模型参数,判断该语音片段是否需要修复;将待修复和已修复音频,忽略时间标记后储存。本发明提高了在固定场景下的判别效率,实现了高精度的判别目标。