检索音频和训练声学模型的方法、终端及存储介质
摘要:
本申请公开了一种检索音频和训练声学模型的方法、终端及存储介质,属于互联网技术领域。该方法包括:提取待检索的目标音频片段的目标频谱数据;基于目标频谱数据,确定目标特征信息;将目标特征信息分别输入训练完成的声学模型中的第一解码器和第二解码器,得到第一目标概率矩阵和第二目标概率矩阵;根据第一目标概率矩阵和第二目标概率矩阵,确定音节序列;确定音节序列分别和参考音节序列库中每个参考音节序列之间的相似度,并确定相似度最大的预设数目个目标参考音节序列,将目标参考音节序列对应的目标音频标识确定为检索结果。本申请可以直接通过音频片段进行检索,避免了当用户不知道歌曲的名称时,无法进行检索的问题。
0/0