-
公开(公告)号:CN113113000A
公开(公告)日:2021-07-13
申请号:CN202110367779.0
申请日:2021-04-06
Applicant: 重庆邮电大学
Abstract: 本发明涉及一种基于自适应掩膜和分组线性变换的轻量级语音识别方法,属于数据处理领域。该方法包括以下步骤:S1:基于自适应掩膜注意力机制的编码;S2:基于分组线性变换。本发明从模型算法角度出发,为解决语音识别在边缘计算设备上的轻量化部署难题提供一种新的方法,通过基于自适应掩膜的局部注意力机制提取语音特征的局部信息并与融合全局信息,使用基于分组线性变换的解码网络,完成对语音高层抽象特征的轻量化解码。
-
公开(公告)号:CN113077795B
公开(公告)日:2022-07-15
申请号:CN202110368665.8
申请日:2021-04-06
Applicant: 重庆邮电大学
Abstract: 本发明涉及一种通道注意力传播与聚合下的声纹识别方法,属于信号处理领域。该方法包括以下步骤:S1:原始语音离散信号的二阶小波散射变换;S2:多尺度特征的声纹映射编码;S3:声纹编码的相似度评估。本发明通过小波散射变换获取多尺度的短时语音特征,采用基于通道注意力传播和聚合的时延神经网络对多尺度特征进行映射得到声纹编码,以提高声纹识别的准确性与鲁棒性。本研究兼顾了长时与短时语音的处理,为含有短时语音数据的声纹识别,提供了新的技术手段,亦可迁移到其他语音处理领域,作为声纹编码的获取方法之一。
-
公开(公告)号:CN113113000B
公开(公告)日:2022-05-13
申请号:CN202110367779.0
申请日:2021-04-06
Applicant: 重庆邮电大学
Abstract: 本发明涉及一种基于自适应掩膜和分组线性变换的轻量级语音识别方法,属于数据处理领域。该方法包括以下步骤:S1:基于自适应掩膜注意力机制的编码;S2:基于分组线性变换。本发明从模型算法角度出发,为解决语音识别在边缘计算设备上的轻量化部署难题提供一种新的方法,通过基于自适应掩膜的局部注意力机制提取语音特征的局部信息并与融合全局信息,使用基于分组线性变换的解码网络,完成对语音高层抽象特征的轻量化解码。
-
公开(公告)号:CN113077795A
公开(公告)日:2021-07-06
申请号:CN202110368665.8
申请日:2021-04-06
Applicant: 重庆邮电大学
Abstract: 本发明涉及一种通道注意力传播与聚合下的声纹识别方法,属于信号处理领域。该方法包括以下步骤:S1:原始语音离散信号的二阶小波散射变换;S2:多尺度特征的声纹映射编码;S3:声纹编码的相似度评估。本发明通过小波散射变换获取多尺度的短时语音特征,采用基于通道注意力传播和聚合的时延神经网络对多尺度特征进行映射得到声纹编码,以提高声纹识别的准确性与鲁棒性。本研究兼顾了长时与短时语音的处理,为含有短时语音数据的声纹识别,提供了新的技术手段,亦可迁移到其他语音处理领域,作为声纹编码的获取方法之一。
-
-
-