-
公开(公告)号:CN109767756A
公开(公告)日:2019-05-17
申请号:CN201910087494.4
申请日:2019-01-29
Applicant: 大连海事大学
Abstract: 本发明公开了一种基于动态分割逆离散余弦变换倒谱系数的音声特征提取算法,具有如下步骤:S1、对音声信号进行预加重、分帧和加窗预处理:S2、对于预处理后的音声信号进行从时域到频域的变换形式处理:S3、利用聚类分析算法,计算步骤S2得到的逆离散余弦变换倒谱系数之间的相似度,并把相似度最大的相邻两类依次合并;迭代以上过程,直至聚类至24类,得到的动态分割逆离散余弦变换倒谱系数即为音声特征。本发明完善了现有技术没有充分利用音声动态特征进行频域变换的缺点,使本发明具有更广泛的适应性,且在说话人识别上可以获得更高的识别精度。
-
公开(公告)号:CN109767756B
公开(公告)日:2021-07-16
申请号:CN201910087494.4
申请日:2019-01-29
Applicant: 大连海事大学
Abstract: 本发明公开了一种基于动态分割逆离散余弦变换倒谱系数的音声特征提取算法,具有如下步骤:S1、对音声信号进行预加重、分帧和加窗预处理:S2、对于预处理后的音声信号进行从时域到频域的变换形式处理:S3、利用聚类分析算法,计算步骤S2得到的逆离散余弦变换倒谱系数之间的相似度,并把相似度最大的相邻两类依次合并;迭代以上过程,直至聚类至24类,得到的动态分割逆离散余弦变换倒谱系数即为音声特征。本发明完善了现有技术没有充分利用音声动态特征进行频域变换的缺点,使本发明具有更广泛的适应性,且在说话人识别上可以获得更高的识别精度。
-
公开(公告)号:CN110197657B
公开(公告)日:2022-03-11
申请号:CN201910430464.9
申请日:2019-05-22
Applicant: 大连海事大学
Abstract: 本发明公开了一种基于余弦相似度的动态音声特征提取方法,包括以下步骤:S1:采用预加重、分帧和加窗方法将语音信号预处理成时域信号,采用窗口函数将语音信号分解为一定长度的帧;S2:将语音时域信号转换成频域信号,获取每帧语音频域信号的320维的离散余弦反变换(IDCT‑Cepstrum Coefficient)倒谱系数;S3:对语音的频域信号进行相邻维之间的余弦相似度计算;S4:找到余弦相似度的两列最大相邻维进行合并;S5:重复操作S3至S4将320维语音频域信号降维到14维的语音频域特征;S6:将语音特征以直方图形式表示。
-
公开(公告)号:CN109979481A
公开(公告)日:2019-07-05
申请号:CN201910181526.7
申请日:2019-03-11
Applicant: 大连海事大学
Abstract: 本发明公开了一种基于相关系数的动态分割逆离散余弦变换倒谱系数的音声特征提取算法,具有如下步骤:S1、对音声信号进行预处理;S2、对预处理后的音声信号进行从时域到频域的变换形式处理;S3、利用聚类分析算法,计算步骤S2得到的逆离散余弦变换倒谱系数矩阵相邻列之间的相似度,并把相关系数向量求和最大的相邻列合并;迭代以上过程,直至合并至14列即得到14类,得到的基于相关系数的动态分割逆离散余弦变换倒谱系数即为音声特征。本发明完善了现有技术没有充分利用S2步骤处理后信号本身所具有的类间相似性特征,使本发明具有更广泛的适应性,且在说话人识别上可以获得更高的识别精度。
-
公开(公告)号:CN118155632A
公开(公告)日:2024-06-07
申请号:CN202410286821.X
申请日:2024-03-13
Applicant: 大连海事大学
IPC: G10L17/02 , G10L19/022 , G10L19/02 , G10L25/18 , G10L25/24
Abstract: 本发明公开了一种基于上下文相关频谱系数动态分割的声纹特征提取算法,包括如下步骤:对读取的语音信号分别进行预处理、频谱转换、上下文特征提取;基于声纹特征向量建立话者识别模型,输入说话人语音进行识别。本发明在现有等频域分割的声纹特征基础上,考虑了分帧后频谱数据的上下文相关性,提出了基于上下文相关的特征提取算法。利用S13步骤完善了处理后信号本身所具有的上下文相关性特征。本发明采用了动态分割方法,在考虑上下文相关性的同时,加强了向量间的特征相似性比较,使本发明具有更广泛的适应性,且在说话人识别上可以获得更高的识别精度。本发明采用线性相关性作为评价指标,具有流程简明,速度快捷,占用计算资源少的优点。
-
公开(公告)号:CN110197657A
公开(公告)日:2019-09-03
申请号:CN201910430464.9
申请日:2019-05-22
Applicant: 大连海事大学
Abstract: 本发明公开了一种基于余弦相似度的动态音声特征提取方法,包括以下步骤:S1:采用预加重、分帧和加窗方法将语音信号预处理成时域信号,采用窗口函数将语音信号分解为一定长度的帧;S2:将语音时域信号转换成频域信号,获取每帧语音频域信号的320维的离散余弦反变换(IDCT-Cepstrum Coefficient)倒谱系数;S3:对语音的频域信号进行相邻维之间的余弦相似度计算;S4:找到余弦相似度的两列最大相邻维进行合并;S5:重复操作S3至S4将320维语音频域信号降维到14维的语音频域特征;S6:将语音特征以直方图形式表示。
-
-
-
-
-