-
公开(公告)号:CN115472181A
公开(公告)日:2022-12-13
申请号:CN202211068244.4
申请日:2022-08-31
Applicant: 北京邮电大学
Abstract: 本发明提供一种基于特征融合和聚类的翻唱识别方法、装置和存储介质,所述方法包括:提取两个输入音频的音频特征;将两个音频特征沿着通道维度进行融合,形成双通道融合特征,利用融合分类特征提取网络提取两个输入音频的分类特征;利用音乐特征聚类网络分别提取两个音频特征的聚类结果;利用二分类决策网络根据两个输入音频的分类特征和各输入音频的聚类结果,输出所述待识别音频的二分类翻唱识别结果。所述方法丰富了音频特征的维度信息,提高了翻唱识别的鲁棒性;丰富了数据标签种类,避免了特征融合的局限性,降低了翻唱识别模型的训练难度,提升了翻唱识别模型的识别性能。