Patent search ap:("大连海事大学") AND inv:"艾佳琪" Page 1

1.

发明公开
一种基于动态分割逆离散余弦变换倒谱系数的音声特征提取算法有权

公开(公告)号：CN109767756A

公开(公告)日：2019-05-17

申请号：CN201910087494.4

申请日：2019-01-29

Applicant: 大连海事大学

Inventor： 左毅 , 马赫 , 李铁山 , 贺培超 , 刘君霞 , 艾佳琪 , 肖杨 , 于仁海

IPC: G10L15/02 , G10L25/24 , G10L25/27

Abstract: 本发明公开了一种基于动态分割逆离散余弦变换倒谱系数的音声特征提取算法，具有如下步骤：S1、对音声信号进行预加重、分帧和加窗预处理：S2、对于预处理后的音声信号进行从时域到频域的变换形式处理：S3、利用聚类分析算法，计算步骤S2得到的逆离散余弦变换倒谱系数之间的相似度，并把相似度最大的相邻两类依次合并；迭代以上过程，直至聚类至24类，得到的动态分割逆离散余弦变换倒谱系数即为音声特征。本发明完善了现有技术没有充分利用音声动态特征进行频域变换的缺点，使本发明具有更广泛的适应性，且在说话人识别上可以获得更高的识别精度。

2.

发明授权
一种基于余弦相似度的动态音声特征提取方法有权

公开(公告)号：CN110197657B

公开(公告)日：2022-03-11

申请号：CN201910430464.9

申请日：2019-05-22

Applicant: 大连海事大学

Inventor： 左毅 , 艾佳琪 , 李铁山 , 陈俊龙 , 肖杨 , 贺培超 , 刘君霞 , 马赫

IPC: G10L15/02 , G10L25/24

Abstract: 本发明公开了一种基于余弦相似度的动态音声特征提取方法，包括以下步骤：S1:采用预加重、分帧和加窗方法将语音信号预处理成时域信号，采用窗口函数将语音信号分解为一定长度的帧；S2:将语音时域信号转换成频域信号，获取每帧语音频域信号的320维的离散余弦反变换(IDCT‑Cepstrum Coefficient)倒谱系数；S3:对语音的频域信号进行相邻维之间的余弦相似度计算；S4:找到余弦相似度的两列最大相邻维进行合并；S5:重复操作S3至S4将320维语音频域信号降维到14维的语音频域特征；S6:将语音特征以直方图形式表示。

3.

发明公开
一种基于相关系数的动态分割逆离散余弦变换倒谱系数的音声特征提取算法无效

公开(公告)号：CN109979481A

公开(公告)日：2019-07-05

申请号：CN201910181526.7

申请日：2019-03-11

Applicant: 大连海事大学

Inventor： 李铁山 , 贺培超 , 刘君霞 , 左毅 , 陈俊龙 , 肖杨 , 马赫 , 艾佳琪

IPC: G10L25/03 , G10L25/45 , G10L25/24 , G10L25/27 , G10L15/02 , G10L15/14

Abstract: 本发明公开了一种基于相关系数的动态分割逆离散余弦变换倒谱系数的音声特征提取算法，具有如下步骤：S1、对音声信号进行预处理；S2、对预处理后的音声信号进行从时域到频域的变换形式处理；S3、利用聚类分析算法，计算步骤S2得到的逆离散余弦变换倒谱系数矩阵相邻列之间的相似度，并把相关系数向量求和最大的相邻列合并；迭代以上过程，直至合并至14列即得到14类，得到的基于相关系数的动态分割逆离散余弦变换倒谱系数即为音声特征。本发明完善了现有技术没有充分利用S2步骤处理后信号本身所具有的类间相似性特征，使本发明具有更广泛的适应性，且在说话人识别上可以获得更高的识别精度。

4.

发明授权
一种基于动态分割逆离散余弦变换倒谱系数的音声特征提取算法有权

公开(公告)号：CN109767756B

公开(公告)日：2021-07-16

申请号：CN201910087494.4

申请日：2019-01-29

Applicant: 大连海事大学

Inventor： 左毅 , 马赫 , 李铁山 , 贺培超 , 刘君霞 , 艾佳琪 , 肖杨 , 于仁海

IPC: G10L15/02 , G10L25/24 , G10L25/27

Abstract: 本发明公开了一种基于动态分割逆离散余弦变换倒谱系数的音声特征提取算法，具有如下步骤：S1、对音声信号进行预加重、分帧和加窗预处理：S2、对于预处理后的音声信号进行从时域到频域的变换形式处理：S3、利用聚类分析算法，计算步骤S2得到的逆离散余弦变换倒谱系数之间的相似度，并把相似度最大的相邻两类依次合并；迭代以上过程，直至聚类至24类，得到的动态分割逆离散余弦变换倒谱系数即为音声特征。本发明完善了现有技术没有充分利用音声动态特征进行频域变换的缺点，使本发明具有更广泛的适应性，且在说话人识别上可以获得更高的识别精度。

5.

发明公开
一种基于余弦相似度的动态音声特征提取方法有权

公开(公告)号：CN110197657A

公开(公告)日：2019-09-03

申请号：CN201910430464.9

申请日：2019-05-22

Applicant: 大连海事大学

Inventor： 左毅 , 艾佳琪 , 李铁山 , 陈俊龙 , 肖杨 , 贺培超 , 刘君霞 , 马赫

IPC: G10L15/02 , G10L25/24

Abstract: 本发明公开了一种基于余弦相似度的动态音声特征提取方法，包括以下步骤：S1:采用预加重、分帧和加窗方法将语音信号预处理成时域信号，采用窗口函数将语音信号分解为一定长度的帧；S2:将语音时域信号转换成频域信号，获取每帧语音频域信号的320维的离散余弦反变换(IDCT-Cepstrum Coefficient)倒谱系数；S3:对语音的频域信号进行相邻维之间的余弦相似度计算；S4:找到余弦相似度的两列最大相邻维进行合并；S5:重复操作S3至S4将320维语音频域信号降维到14维的语音频域特征；S6:将语音特征以直方图形式表示。

Patent Agency Ranking