-
公开(公告)号:CN1201285C
公开(公告)日:2005-05-11
申请号:CN200310115044.0
申请日:2003-11-20
Applicant: 中国科学院声学研究所 , 北京中科信利技术有限公司
IPC: G10L15/00
Abstract: 本发明公开了一种语音识别中的并行搜索方法,由多个线程对令牌扩展进行并行运算,各线程按索引单位分配得到各自的t-1时刻词典树的令牌资源,对于分配的t-1时刻的令牌资源,线程Ti对各状态的全局令牌链表中的令牌进行扩展运算,并将新产生的令牌链入目标状态中线程Ti对应的令牌链表中,在所有线程的扩展运算完成后,进行令牌资源的同步运算,本发明方法可在相当程度上实现多处理器系统中处理器间的计算负载平衡。且在并行搜索引擎中令牌扩展线程间的通信开销非常低。
-
公开(公告)号:CN1190773C
公开(公告)日:2005-02-23
申请号:CN02148684.0
申请日:2002-11-15
Applicant: 中国科学院声学研究所 , 北京中科信利技术有限公司
IPC: G10L15/00
Abstract: 本发明公开一种用于语音识别系统的特征矢量集的压缩方法,在对语音特征矢量集聚类得到码本的过程中,增加了根据子集合中矢量数及矢量的总距离度量来动态合并和分裂子集合的步骤,减小了聚类后集合中矢量与其对应的码字的距离度量总和,提高了聚类算法的精度,将本发明方法压缩后的码本应用于语音识别系统中,可在保证语音系统识别性能的同时,大大降低了系统的存储量。本发明还公开一种语音识别系统,用特征码本和概率表代替声学模型,在解码的过程中不需要计算高斯概率,只须从预先存储的概率表中查找出所需的概率值,大大减少了解码运算量,因而可极大地提高系统的识别速度。
-
公开(公告)号:CN1503220A
公开(公告)日:2004-06-09
申请号:CN200310115044.0
申请日:2003-11-20
Applicant: 中国科学院声学研究所 , 北京中科信利技术有限公司
IPC: G10L15/00
Abstract: 本发明公开了一种语音识别中的并行搜索方法,由多个线程对令牌扩展进行并行运算,各线程按索引单位分配得到各自的t-1时刻词典树的令牌资源,对于分配的t-1时刻的令牌资源,线程Ti对各状态的全局令牌链表中的令牌进行扩展运算,并将新产生的令牌链入目标状态中线程Ti对应的令牌链表中,在所有线程的扩展运算完成后,进行令牌资源的同步运算,本发明方法可在相当程度上实现多处理器系统中处理器间的计算负载平衡。且在并行搜索引擎中令牌扩展线程间的通信开销非常低。
-
公开(公告)号:CN103077709A
公开(公告)日:2013-05-01
申请号:CN201210587263.8
申请日:2012-12-28
Applicant: 中国科学院声学研究所 , 北京中科信利技术有限公司
IPC: G10L15/14
Abstract: 本发明涉及一种基于共有鉴别性子空间映射的语种识别方法及装置,该方法包括:提取一个语种的多个语音数据的语音特征;根据所述语音特征得到所述多个语音数据的高斯超向量,其中,每个语音数据对应一组高斯超向量;将所述高斯超向量映射到共有鉴别性子空间,得到与所述高斯超向量对应的低维向量,其中,所述共有鉴别性子空间是预先用多个语种的语音数据建立的;以及分别计算所述低维向量在多个支持向量机SVM模型上的得分,根据多个得分识别出所述语种,其中,所述多个SVM模型是预先根据所述共有鉴别性子空间训练出来的,每个SVM模型对应一个语种。相比于直接对高斯超向量进行建模,本发明的语种识别方法由于其低维和鉴别性,训练速度更快,识别性能有了明显提高。
-
公开(公告)号:CN102074240B
公开(公告)日:2012-03-14
申请号:CN201010621150.6
申请日:2010-12-24
Applicant: 中国科学院声学研究所 , 北京中科信利技术有限公司
IPC: G10L19/00
Abstract: 本发明涉及一种用数字音频水印进行版权管理的方法,该方法将水印信号嵌入到音频信号能量的对数域中使解码与幅度无关;通过对嵌入的水印信息的帧结构进行合理设计,使得解嵌结果的时长统计精度达到秒级,并且在各种剪切、拼接、插入其他音频信号等操作下解码时间精度和解码正确率不受影响;嵌入的信息采用RSA数字签名算法进行加密,使得嵌入信息具有保密性;嵌入算法有效地利用了音频的短时平稳具有的相关性减少了载体音频对水印信息的干扰,从而显著地改善了水印解出的成功率和准确率。本方法通过引入数字水印技术对入媒资库的音频素材进行标识,之后通过对播出流或音频文件的解码分析得到素材的使用情况,从而获得版权付费信息。
-
公开(公告)号:CN101430876B
公开(公告)日:2012-03-14
申请号:CN200710177034.8
申请日:2007-11-08
Applicant: 中国科学院声学研究所
Abstract: 本发明公开了一种演唱的评分系统和方法,通过对演唱语音信号进行音符切分、量化,搜索歌曲中的对应演唱歌曲片段,计算多种距离,并综合得到演唱评分。通过应用本发明,使得只要演唱数据在旋律上与原声有较好的一致性,就可以得到较准确的评价得分,同时,本发明的评价系统无需演唱与伴奏完全同步,而是利用定位技术进行匹配,使得本发明可以对演唱者的演唱片断进行评价,不依赖于同步信息的输入或要求演唱者从歌曲的开始唱到结尾。
-
公开(公告)号:CN102074240A
公开(公告)日:2011-05-25
申请号:CN201010621150.6
申请日:2010-12-24
Applicant: 中国科学院声学研究所 , 北京中科信利技术有限公司
IPC: G10L19/00
Abstract: 本发明涉及一种用数字音频水印进行版权管理的方法,该方法将水印信号嵌入到音频信号能量的对数域中使解码与幅度无关;通过对嵌入的水印信息的帧结构进行合理设计,使得解嵌结果的时长统计精度达到秒级,并且在各种剪切、拼接、插入其他音频信号等操作下解码时间精度和解码正确率不受影响;嵌入的信息采用RSA数字签名算法进行加密,使得嵌入信息具有保密性;嵌入算法有效地利用了音频的短时平稳具有的相关性减少了载体音频对水印信息的干扰,从而显著地改善了水印解出的成功率和准确率。本方法通过引入数字水印技术对入媒资库的音频素材进行标识,之后通过对播出流或音频文件的解码分析得到素材的使用情况,从而获得版权付费信息。
-
公开(公告)号:CN101650940A
公开(公告)日:2010-02-17
申请号:CN200810224789.3
申请日:2008-12-26
Applicant: 中国科学院声学研究所 , 北京中科信利技术有限公司
IPC: G10L11/00
Abstract: 本发明提供一种基于演唱片段频谱特征分析的音色纯净度客观评测方法,包括如下步骤:1)选取需要度量音色纯净度的演唱片段音频信号;2)对步骤1)的演唱信号进行基频提取;3)用步骤2)中量化出的基频序列定位音频信号中所有浊音段的谐波结构;4)根据步骤3)中得到的谐波结构,计算得到四种频谱特征测度:谐波结构能量和、噪声能量、宽带能量和以及窄带能量和;5)根据步骤4)中得到的频谱特征,计算得到最终的音色纯净度的客观度量参数指标:平均谐噪比以及平均窄带宽带能量比,利用求出的参数指标对演唱音色的纯净度进行评测。本发明的评测方法,利用计算机算法给出量化的指标,不受人为因素影响并具有稳定性、客观性及便利性等优点。
-
公开(公告)号:CN101430876A
公开(公告)日:2009-05-13
申请号:CN200710177034.8
申请日:2007-11-08
Applicant: 中国科学院声学研究所
Abstract: 本发明公开了一种演唱的评分系统和方法,通过对演唱语音信号进行音符切分、量化,搜索歌曲中的对应演唱歌曲片段,计算多种距离,并综合得到演唱评分。通过应用本发明,使得只要演唱数据在旋律上与原声有较好的一致性,就可以得到较准确的评价得分,同时,本发明的评价系统无需演唱与伴奏完全同步,而是利用定位技术进行匹配,使得本发明可以对演唱者的演唱片断进行评价,不依赖于同步信息的输入或要求演唱者从歌曲的开始唱到结尾。
-
公开(公告)号:CN1963919A
公开(公告)日:2007-05-16
申请号:CN200510117698.6
申请日:2005-11-08
Applicant: 中国科学院声学研究所 , 北京中科信利技术有限公司
IPC: G10L19/00
Abstract: 本发明涉及一种对单音进行音符切分的方法,更具体的说,本发明涉及一种基于能量的音符切分方法,包括:1)对语音信号进行分帧处理;2)计算出每一帧的谐波和能量。3)计算出每一帧的谐波和能量突出度δ;4)通过前后比较找出整个语音信号中突出度δ的极值点;5)判断突出度δ极值点是否大于1,若判断为是,则把该极值点所在帧作为音符分割点。与现有技术相比,本发明的优点是:对于能量变化的各种情况有统一稳定的计算方式,音符切分的判决简单可靠。
-
-
-
-
-
-
-
-
-