Patent search ap:("广州汇智通信技术有限公司") AND inv:"罗柳平" Page 1

1.

发明公开
一种基于可变粒度特征的音频检索方法和装置有权

公开(公告)号：CN117877525A

公开(公告)日：2024-04-12

申请号：CN202410282560.4

申请日：2024-03-13

Applicant: 广州汇智通信技术有限公司

Inventor： 朱文海 , 罗柳平 , 苏宇 , 阎伟萍 , 钟杰

IPC: G10L25/54 , G10L19/02 , G10L25/03 , G06F16/683

Abstract: 本发明公开了一种基于可变粒度特征的音频检索方法和装置，方法包括当接收到待检索音频时，对待检索音频执行分帧提取，生成第一粒度的第一音频特征序列，并从待检索音频中筛选初始音频，响应接收到的多个语音模板，构建对应的特征查找地图，根据特征查找地图检索第一音频特征序列，根据第一检索结果从初始音频中选取中间音频，对中间音频执行分帧提取，生成第二粒度的第二音频特征序列，根据特征查找地图检索第二音频特征序列，根据第二检索结果定位目标语音。从而通过不同粒度的音频特征序列匹配语音模板的方式，以粗粒度排除海量非目标语音，细粒度完全匹配目标语音的方式，有效提高音频匹配的可靠性和准确度。

2.

发明授权
一种基于可变粒度特征的音频检索方法和装置有权

公开(公告)号：CN117877525B

公开(公告)日：2024-06-18

申请号：CN202410282560.4

申请日：2024-03-13

Applicant: 广州汇智通信技术有限公司

Inventor： 朱文海 , 罗柳平 , 苏宇 , 阎伟萍 , 钟杰

IPC: G10L25/54 , G10L19/02 , G10L25/03 , G06F16/683

Abstract: 本发明公开了一种基于可变粒度特征的音频检索方法和装置，方法包括当接收到待检索音频时，对待检索音频执行分帧提取，生成第一粒度的第一音频特征序列，并从待检索音频中筛选初始音频，响应接收到的多个语音模板，构建对应的特征查找地图，根据特征查找地图检索第一音频特征序列，根据第一检索结果从初始音频中选取中间音频，对中间音频执行分帧提取，生成第二粒度的第二音频特征序列，根据特征查找地图检索第二音频特征序列，根据第二检索结果定位目标语音。从而通过不同粒度的音频特征序列匹配语音模板的方式，以粗粒度排除海量非目标语音，细粒度完全匹配目标语音的方式，有效提高音频匹配的可靠性和准确度。

Patent Agency Ranking