一种基于可变粒度特征的音频检索方法和装置

    公开(公告)号:CN117877525A

    公开(公告)日:2024-04-12

    申请号:CN202410282560.4

    申请日:2024-03-13

    Abstract: 本发明公开了一种基于可变粒度特征的音频检索方法和装置,方法包括当接收到待检索音频时,对待检索音频执行分帧提取,生成第一粒度的第一音频特征序列,并从待检索音频中筛选初始音频,响应接收到的多个语音模板,构建对应的特征查找地图,根据特征查找地图检索第一音频特征序列,根据第一检索结果从初始音频中选取中间音频,对中间音频执行分帧提取,生成第二粒度的第二音频特征序列,根据特征查找地图检索第二音频特征序列,根据第二检索结果定位目标语音。从而通过不同粒度的音频特征序列匹配语音模板的方式,以粗粒度排除海量非目标语音,细粒度完全匹配目标语音的方式,有效提高音频匹配的可靠性和准确度。

    一种基于可变粒度特征的音频检索方法和装置

    公开(公告)号:CN117877525B

    公开(公告)日:2024-06-18

    申请号:CN202410282560.4

    申请日:2024-03-13

    Abstract: 本发明公开了一种基于可变粒度特征的音频检索方法和装置,方法包括当接收到待检索音频时,对待检索音频执行分帧提取,生成第一粒度的第一音频特征序列,并从待检索音频中筛选初始音频,响应接收到的多个语音模板,构建对应的特征查找地图,根据特征查找地图检索第一音频特征序列,根据第一检索结果从初始音频中选取中间音频,对中间音频执行分帧提取,生成第二粒度的第二音频特征序列,根据特征查找地图检索第二音频特征序列,根据第二检索结果定位目标语音。从而通过不同粒度的音频特征序列匹配语音模板的方式,以粗粒度排除海量非目标语音,细粒度完全匹配目标语音的方式,有效提高音频匹配的可靠性和准确度。

Patent Agency Ranking