-
公开(公告)号:CN113611315B
公开(公告)日:2023-09-22
申请号:CN202110886681.6
申请日:2021-08-03
Applicant: 南开大学
IPC: G10L17/18 , G10L25/24 , G06N3/0464 , G10L25/30
Abstract: 一种基于轻量化卷积神经网络的声纹识别方法和装置,解决了现有技术中声纹识别技术精度低且网络参数量和计算量过大的问题。声纹识别方法包括:基于声学特征向量,顺次执行多个特征提取子例程,分别得到多个第四声纹特征向量;基于部分第四声纹特征向量确定第五声纹特征向量;采用低秩矩阵分解技术对第五声纹特征向量进行全连接,得到第六声纹特征向量;根据第六声纹特征向量进行声纹识别。其中,特征提取子例程包括:对输入特征向量进行多个不同空洞率的深度可分离卷积操作,得到多个第一声纹特征向量,确定多个第一声纹特征向量各自的权重向量,基于权重向量对多个第一声纹特征向量进行加权融合,得到第二声纹特征向量。
-
公开(公告)号:CN113611315A
公开(公告)日:2021-11-05
申请号:CN202110886681.6
申请日:2021-08-03
Applicant: 南开大学
Abstract: 一种基于轻量化卷积神经网络的声纹识别方法和装置,解决了现有技术中声纹识别技术精度低且网络参数量和计算量过大的问题。声纹识别方法包括:基于声学特征向量,顺次执行多个特征提取子例程,分别得到多个第四声纹特征向量;基于部分第四声纹特征向量确定第五声纹特征向量;采用低秩矩阵分解技术对第五声纹特征向量进行全连接,得到第六声纹特征向量;根据第六声纹特征向量进行声纹识别。其中,特征提取子例程包括:对输入特征向量进行多个不同空洞率的深度可分离卷积操作,得到多个第一声纹特征向量,确定多个第一声纹特征向量各自的权重向量,基于权重向量对多个第一声纹特征向量进行加权融合,得到第二声纹特征向量。
-