-
公开(公告)号:CN1674092B
公开(公告)日:2010-06-09
申请号:CN200410033216.4
申请日:2004-03-26
Applicant: 松下电器产业株式会社
Abstract: 一种用于汉语连续数字识别的声学建模方法,包括步骤:a)为汉语连续数字的不同的声、韵母单独建立模型;b)定义汉语连续数字的上下文相关性,建立上下文相关的声学模型,以准确刻画连续数字语音;c)以隐马尔可夫(HMM)模型为基本模型表示,利用状态聚类算法对连续数字的隐马尔可夫模型的参数进行训练,得到连续数字声学模型。另外,本发明还公开了汉语连续数字的声母、韵母跨词搜索解码方法,以及声学建模系统和搜索解码系统。
-
公开(公告)号:CN1655232A
公开(公告)日:2005-08-17
申请号:CN200410004131.3
申请日:2004-02-13
Applicant: 松下电器产业株式会社
IPC: G10L15/00
Abstract: 一种上下文相关的汉语语音识别建模方法,基于汉语的语言特点,采用声母右相关和韵母左相关的建模方法,包括步骤:(a)将汉语语音的声母与紧邻其右侧的韵母相关,而韵母与紧邻其左侧的声母相关,创建上下文相关的基本建模单元;(b)利用状态聚类法对模型的参数进行训练,以得到初始隐马尔可夫模型(HMM);(c)利用子空间聚类算法对初始隐马尔可夫模型进行压缩,以产生最终模型。
-
公开(公告)号:CN103229233A
公开(公告)日:2013-07-31
申请号:CN201080070321.9
申请日:2010-12-10
Applicant: 松下电器产业株式会社
IPC: G10L15/14
CPC classification number: G10L17/04
Abstract: 本发明实现用于识别说话人的建模设备和方法、以及说话人识别系统。建模设备包括:前端,从各目标说话人取得登记语音数据;参考锚集合生成单元,基于锚空间使用登记语音数据生成参考锚集合;以及声纹生成单元,基于参考锚集合和登记语音数据生成声纹。在本公开中,通过考虑登记语音和说话人自适应技术,能够生成尺寸更小的锚模型,因而能够进行具有尺寸更小的参考锚集合的、可靠性高的鲁棒的说话人识别。这对于进行计算速度的改善以及大幅度的存储器削减是非常有利的。
-
公开(公告)号:CN103221996A
公开(公告)日:2013-07-24
申请号:CN201080070323.8
申请日:2010-12-10
Applicant: 松下电器产业株式会社
IPC: G10L17/00
Abstract: 提供用于验证说话人的口令建模的设备和方法、以及说话人验证系统。设备包括:前端,从目标说话人获得登记语音;以及模板生成单元,基于登记语音利用普通说话人模型生成口令模板。在设备、方法、以及系统中,通过考虑普通说话人模型中包含的丰富的变异,即使在登记数据不充分的情况下,或者来自目标说话人的可利用的口令仅有一个时,也能可靠地进行鲁棒的口令建模。
-
公开(公告)号:CN102473409A
公开(公告)日:2012-05-23
申请号:CN201180002465.5
申请日:2011-04-19
Applicant: 松下电器产业株式会社
IPC: G10L11/00
CPC classification number: G10L25/57 , G10L2015/0631
Abstract: 本发明提供一种在利用AV流中的音频流来执行AV流的分类等的装置中,对执行该分类时所使用的声音空间基准模型进行在线自适应调节的装置以及其方法。该装置将所输入的音频流分割成具有相同声音特征的片段数据,并对所分割得到的片段数据的单一概率模型进行估计。其后,针对所估计的单一概率模型与到此为止所存储的其他的声音特征的单一概率模型执行聚类,来生成新的声音空间的基准模型。
-
公开(公告)号:CN1841500B
公开(公告)日:2010-04-14
申请号:CN200510062908.6
申请日:2005-03-30
Applicant: 松下电器产业株式会社
Abstract: 本发明揭示一种基于自适应非线性谱减的语音识别抗噪方法,包括步骤:基于平均梅尔频带信噪比进行语音检测,当平均信噪比大于预定的信噪比阈值时则判断为语音信息,否则判断为噪音信息;根据在语音检测步骤中得到的噪音帧更新当前的噪音估计,进行第一次谱减计算,获得具有高信噪比的含噪语音;对具有高信噪比的含噪语音进行第二次谱减计算以进一步消除含噪语音信号中的噪声。
-
公开(公告)号:CN1655232B
公开(公告)日:2010-04-21
申请号:CN200410004131.3
申请日:2004-02-13
Applicant: 松下电器产业株式会社
IPC: G10L15/00
Abstract: 一种上下文相关的汉语语音识别建模方法,基于汉语的语言特点,采用声母右相关和韵母左相关的建模方法,包括步骤:(a)将汉语语音的声母与紧邻其右侧的韵母相关,而韵母与紧邻其左侧的声母相关,创建上下文相关的基本建模单元;(b)利用状态聚类法对模型的参数进行训练,以得到初始隐马尔可夫模型(HMM);(c)利用子空间聚类算法对初始隐马尔可夫模型进行压缩,以产生最终模型。
-
公开(公告)号:CN1674092A
公开(公告)日:2005-09-28
申请号:CN200410033216.4
申请日:2004-03-26
Applicant: 松下电器产业株式会社
Abstract: 一种用于汉语连续数字识别的声学建模方法,包括步骤:a)为汉语连续数字的不同的声、韵母单独建立模型;b)定义汉语连续数字的上下文相关性,建立上下文相关的声学模型,以准确刻画连续数字语音c)以隐马尔可夫(HMM)模型为基本模型表示,利用状态聚类算法对连续数字的隐马尔可夫模型的参数进行训练,得到连续数字声学模型。另外,本发明还公开了汉语连续数字的声母、韵母跨词搜索解码方法,以及声学建模系统和搜索解码系统。
-
公开(公告)号:CN102473409B
公开(公告)日:2014-04-23
申请号:CN201180002465.5
申请日:2011-04-19
Applicant: 松下电器产业株式会社
IPC: G10L25/57
CPC classification number: G10L25/57 , G10L2015/0631
Abstract: 本发明提供一种在利用AV流中的音频流来执行AV流的分类等的装置中,对执行该分类时所使用的声音空间基准模型进行在线自适应调节的装置以及其方法。该装置将所输入的音频流分割成具有相同声音特征的片段数据,并对所分割得到的片段数据的单一概率模型进行估计。其后,针对所估计的单一概率模型与到此为止所存储的其他的声音特征的单一概率模型执行聚类,来生成新的声音空间的基准模型。
-
公开(公告)号:CN102237084A
公开(公告)日:2011-11-09
申请号:CN201010155674.0
申请日:2010-04-22
Applicant: 松下电器产业株式会社
CPC classification number: G10L25/57 , G10L2015/0631
Abstract: 公开了一种在AV设备中用输入的AV流中包含的音频流对声音空间的基准模型进行在线自适应调节的方法和装置及设备。该方法包括步骤:估计音频流中每个声音事件的单一概率模型,所述声音事件具有单一的声学特征;针对事先存储的至少一个单一概率模型和各个声音事件的单一概率模型进行聚类,以更新所述声音空间的基准模型。利用上述方案,可以根据随时输入的AV流来自适应在线调节声音空间的基准模型,从而避免了聚类过程中的遗漏。即使对于较长AV流中的一小段声音事件,也能够实现正确的聚类。
-
-
-
-
-
-
-
-
-