连续数字识别的声韵母跨词建模、解码方法及系统

    公开(公告)号:CN1674092B

    公开(公告)日:2010-06-09

    申请号:CN200410033216.4

    申请日:2004-03-26

    Inventor: 贾磊 马龙

    Abstract: 一种用于汉语连续数字识别的声学建模方法,包括步骤:a)为汉语连续数字的不同的声、韵母单独建立模型;b)定义汉语连续数字的上下文相关性,建立上下文相关的声学模型,以准确刻画连续数字语音;c)以隐马尔可夫(HMM)模型为基本模型表示,利用状态聚类算法对连续数字的隐马尔可夫模型的参数进行训练,得到连续数字声学模型。另外,本发明还公开了汉语连续数字的声母、韵母跨词搜索解码方法,以及声学建模系统和搜索解码系统。

    上下文相关的汉语语音识别建模方法

    公开(公告)号:CN1655232A

    公开(公告)日:2005-08-17

    申请号:CN200410004131.3

    申请日:2004-02-13

    Inventor: 贾磊 马龙

    Abstract: 一种上下文相关的汉语语音识别建模方法,基于汉语的语言特点,采用声母右相关和韵母左相关的建模方法,包括步骤:(a)将汉语语音的声母与紧邻其右侧的韵母相关,而韵母与紧邻其左侧的声母相关,创建上下文相关的基本建模单元;(b)利用状态聚类法对模型的参数进行训练,以得到初始隐马尔可夫模型(HMM);(c)利用子空间聚类算法对初始隐马尔可夫模型进行压缩,以产生最终模型。

    用于识别说话人的建模设备和方法、以及说话人识别系统

    公开(公告)号:CN103229233A

    公开(公告)日:2013-07-31

    申请号:CN201080070321.9

    申请日:2010-12-10

    CPC classification number: G10L17/04

    Abstract: 本发明实现用于识别说话人的建模设备和方法、以及说话人识别系统。建模设备包括:前端,从各目标说话人取得登记语音数据;参考锚集合生成单元,基于锚空间使用登记语音数据生成参考锚集合;以及声纹生成单元,基于参考锚集合和登记语音数据生成声纹。在本公开中,通过考虑登记语音和说话人自适应技术,能够生成尺寸更小的锚模型,因而能够进行具有尺寸更小的参考锚集合的、可靠性高的鲁棒的说话人识别。这对于进行计算速度的改善以及大幅度的存储器削减是非常有利的。

    一种基于自适应非线性谱减的抗噪方法和装置

    公开(公告)号:CN1841500B

    公开(公告)日:2010-04-14

    申请号:CN200510062908.6

    申请日:2005-03-30

    Inventor: 贾磊 马龙

    Abstract: 本发明揭示一种基于自适应非线性谱减的语音识别抗噪方法,包括步骤:基于平均梅尔频带信噪比进行语音检测,当平均信噪比大于预定的信噪比阈值时则判断为语音信息,否则判断为噪音信息;根据在语音检测步骤中得到的噪音帧更新当前的噪音估计,进行第一次谱减计算,获得具有高信噪比的含噪语音;对具有高信噪比的含噪语音进行第二次谱减计算以进一步消除含噪语音信号中的噪声。

    上下文相关的汉语语音识别建模方法

    公开(公告)号:CN1655232B

    公开(公告)日:2010-04-21

    申请号:CN200410004131.3

    申请日:2004-02-13

    Inventor: 贾磊 马龙

    Abstract: 一种上下文相关的汉语语音识别建模方法,基于汉语的语言特点,采用声母右相关和韵母左相关的建模方法,包括步骤:(a)将汉语语音的声母与紧邻其右侧的韵母相关,而韵母与紧邻其左侧的声母相关,创建上下文相关的基本建模单元;(b)利用状态聚类法对模型的参数进行训练,以得到初始隐马尔可夫模型(HMM);(c)利用子空间聚类算法对初始隐马尔可夫模型进行压缩,以产生最终模型。

    连续数字识别的声韵母跨词建模、解码方法及系统

    公开(公告)号:CN1674092A

    公开(公告)日:2005-09-28

    申请号:CN200410033216.4

    申请日:2004-03-26

    Inventor: 贾磊 马龙

    Abstract: 一种用于汉语连续数字识别的声学建模方法,包括步骤:a)为汉语连续数字的不同的声、韵母单独建立模型;b)定义汉语连续数字的上下文相关性,建立上下文相关的声学模型,以准确刻画连续数字语音c)以隐马尔可夫(HMM)模型为基本模型表示,利用状态聚类算法对连续数字的隐马尔可夫模型的参数进行训练,得到连续数字声学模型。另外,本发明还公开了汉语连续数字的声母、韵母跨词搜索解码方法,以及声学建模系统和搜索解码系统。

    声音空间基准模型的在线自适应调节方法及装置和设备

    公开(公告)号:CN102237084A

    公开(公告)日:2011-11-09

    申请号:CN201010155674.0

    申请日:2010-04-22

    CPC classification number: G10L25/57 G10L2015/0631

    Abstract: 公开了一种在AV设备中用输入的AV流中包含的音频流对声音空间的基准模型进行在线自适应调节的方法和装置及设备。该方法包括步骤:估计音频流中每个声音事件的单一概率模型,所述声音事件具有单一的声学特征;针对事先存储的至少一个单一概率模型和各个声音事件的单一概率模型进行聚类,以更新所述声音空间的基准模型。利用上述方案,可以根据随时输入的AV流来自适应在线调节声音空间的基准模型,从而避免了聚类过程中的遗漏。即使对于较长AV流中的一小段声音事件,也能够实现正确的聚类。

Patent Agency Ranking