-
公开(公告)号:CN101383149A
公开(公告)日:2009-03-11
申请号:CN200810137404.X
申请日:2008-10-27
Applicant: 哈尔滨工业大学
IPC: G10L11/00
Abstract: 弦乐音乐颤音自动检测方法,它涉及一种在自动音乐标注过程中对弦乐音乐实时检测的方法,以解决在弦乐音乐自动标注过程中,颤音对于自动音乐标注的影响较大以及传统的自动音乐标注方法不能对音乐中的颤音进行自动检测的问题。根据弦乐常用音域的音符数将颤音分为N类,通过音频识别的方法将N类颤音模型训练为匹配对象库;将输入待检测的音乐的音频信号,对音频信号进行特征提取得到特征矢量序列;以统计出来的颤音平均周期为长度对特征矢量序列进行分段;通过音频识别的方法对每一段矢量序列进行识别;连续M或M以上段被识别为同一类颤音的矢量序列所对应的时间段即检测为颤音的时间段。本发明自动检测颤音,去除颤音对于自动音乐标注的影响。
-
公开(公告)号:CN101315771A
公开(公告)日:2008-12-03
申请号:CN200810064669.1
申请日:2008-06-04
Applicant: 哈尔滨工业大学
IPC: G10L17/00
Abstract: 说话人识别中不同语音编码影响的补偿方法,它涉及一种在因特网上对说话人识别语音编码不匹配时的补偿方法,以解决在说话人识别中,训练语音和测试语音编码不匹配造成说话人识别性能下降的问题。本方法将说话人在标准编码方式下的语音信号进行特征处理和最大期望算法训练得到的标准编码方式下的说话人模型作为匹配对象库;输入待识别说话人的语音信号,进行特征提取得到特征矢量序列;在特征序列中选其前T帧得到序列进行MAP算法自适应获得当前编码和标准编码的偏差;用获得的当前编码和标准编码偏差对原特征序列作调整补偿,得到新特征矢量序列;用新特征矢量序列分别与标准编码方式下的说话人模型进行匹配和判决获得识别结果。
-