用于检测连续语音中的关键词的设备和方法

    公开(公告)号:CN102194454A

    公开(公告)日:2011-09-21

    申请号:CN201010119995.5

    申请日:2010-03-05

    Inventor: 李鹏 郭庆 王彬

    Abstract: 本发明公开了一种语音关键词检测设备和方法,其中所述设备包括:输入装置,用于输入连续语音;识别装置,用于从连续语音中识别候选关键词,并给出相应的置信度,并且识别连续语音中包括的填充音;韵律特征提取装置,用于提取与特定相邻填充音相关的韵律特征;韵律词边界确定装置,用于根据韵律特征来确定特定相邻填充音之间的边界为韵律词边界的概率;置信度调整装置,用于根据与候选关键词对应的语音片段所包括的特定相邻填充音之间的边界为韵律词边界的概率,调整候选关键词的置信度;判决设置,用于判决调整后的候选关键词的置信度是否高于预先设定的阈值;以及输出装置,将调整后的置信度高于预先设定的阈值的候选关键词作为关键词输出。

    语音情感识别设备和进行语音情感识别的方法

    公开(公告)号:CN101930735A

    公开(公告)日:2010-12-29

    申请号:CN200910150458.4

    申请日:2009-06-23

    Abstract: 语音情感识别设备和进行语音情感识别的方法。语音情感识别设备包含:分析装置,其将输入语音的情感特征与多个情感模型进行匹配,以确定多个可能情感状态;概率计算装置,其根据说话人说话过程中情感状态之间的转换的条件概率知识,计算在说话人先前情感状态的条件下所述可能情感状态的最终概率;和情感判断装置,其从所述可能情感状态中选择最终概率最大的可能情感状态作为所述输入语音的情感状态。

    一种语音数据处理方法及系统

    公开(公告)号:CN102831891A

    公开(公告)日:2012-12-19

    申请号:CN201110166864.7

    申请日:2011-06-13

    Inventor: 王彬 刘汝杰

    Abstract: 本发明实施例公开了一种语音数据处理方法及系统,其中,所述方法包括:将待处理语音数据划分为语音片段;提取各个语音片段中的声学特征,并获取各个语音片段在所述语音数据中的上下文信息;针对各个语音片段,根据所述上下文信息以及分别在各种情感状态下建立的基于上下文信息的语音片段分类模型,确定语音片段在各种情感状态下分别所属的语音片段类别;根据语音片段中的声学特征以及预先针对所述所属的语音片段类别建立的情感模型,确定语音片段属于各种情感状态的概率,并根据所述概率,确定语音片段所属的情感状态以便根据所述语音片段所属的情感状态,对所述待处理语音数据进行情感识别。通过本发明,能够提高语音情感识别的有效性及准确度。

    语音情感识别设备和进行语音情感识别的方法

    公开(公告)号:CN101930735B

    公开(公告)日:2012-11-21

    申请号:CN200910150458.4

    申请日:2009-06-23

    Abstract: 语音情感识别设备和进行语音情感识别的方法。语音情感识别设备包含:分析装置,其将输入语音的情感特征与多个情感模型进行匹配,以确定多个可能情感状态;概率计算装置,其根据从关于说话人说话过程中情感状态之间的转换的条件概率知识中寻找到的、已确定的情感状态和可能情感状态间的条件概率,计算在说话人先前情感状态的条件下所述可能情感状态的最终概率;和情感判断装置,其从所述可能情感状态中选择最终概率最大的可能情感状态作为所述输入语音的情感状态,其中分析装置进一步被配置为输出可能情感状态的出现概率,并且概率计算装置被进一步配置为结合出现概率来计算最终概率;以及其中最终概率基于出现概率和条件概率的加权和。

    使语音合成时长模型自适应的方法和设备

    公开(公告)号:CN101814288A

    公开(公告)日:2010-08-25

    申请号:CN200910007682.8

    申请日:2009-02-20

    Inventor: 郭庆 王彬 陆应亮

    Abstract: 使语音合成时长模型自适应的方法和设备。设备包括:参考模型生成装置,其根据所述语音合成时长模型的分类结构对参考样本数据中每个语音合成单元的样本进行分类,通过计算对应于每个分类的样本集的参考样本数目和参考时长,生成参考语音合成时长模型;和模型自适应装置,其使所述语音合成时长模型中每个语音合成单元的每个时长,适应所述参考语音合成时长模型中相同语音合成单元的、对应于所述时长的分类的参考时长。

    基于韵律参照的语音合成装置和方法

    公开(公告)号:CN101685633A

    公开(公告)日:2010-03-31

    申请号:CN200810166002.2

    申请日:2008-09-28

    Inventor: 郭庆 陆应亮 王彬

    Abstract: 本发明提供基于韵律参照的语音合成装置和方法。该语音合成装置包括:韵律参数获取部,其通过对按包括自然人朗读待合成文本在内的方式而获得的录音文件进行分析,或者对以预定标注标准对待合成文本进行韵律参数标注而获得的韵律参数标注文件进行分析,来获取自然韵律参数或近似自然韵律参数;和音声作成部,其以该自然韵律参数或近似自然韵律参数作为参照,针对该待合成文本从预录语音库中选择相应的语音合成单元,并对所述语音合成单元进行拼接合成,以产生对应于该待合成文本的合成语音文件。根据本发明的语音合成装置和方法,可以根据用户的要求生成富有感情色彩且抑扬顿挫程度与自然语音非常接近的高自然度的合成语音。

    识别语音信号中所承载的情感状态的方法和系统

    公开(公告)号:CN102637433A

    公开(公告)日:2012-08-15

    申请号:CN201110037314.5

    申请日:2011-02-09

    Abstract: 公开了一种生成语音情感模型的方法、设备以及识别语音信号中所承载的情感状态的方法、设备。生成语音情感模型的方法包括以下步骤:通过无监督聚类将标注为同一情感状态的多个情感语音样本聚类成n个子类,每个子类对应于同一情感状态的不同情感表达方式中的一种情感表达方式;以及为每个子类中的情感语音样本生成一个语音情感模型,从而得到分别对应于n个子类的n个语音情感模型,n个语音情感模型用于识别语音信号所承载的不同情感表达方式的情感状态,其中,n为大于或等于2的整数。

    一种语音数据处理方法及系统

    公开(公告)号:CN102831891B

    公开(公告)日:2014-11-05

    申请号:CN201110166864.7

    申请日:2011-06-13

    Inventor: 王彬 刘汝杰

    Abstract: 本发明实施例公开了一种语音数据处理方法及系统,其中,所述方法包括:将待处理语音数据划分为语音片段;提取各个语音片段中的声学特征,并获取各个语音片段在所述语音数据中的上下文信息;针对各个语音片段,根据所述上下文信息以及分别在各种情感状态下建立的基于上下文信息的语音片段分类模型,确定语音片段在各种情感状态下分别所属的语音片段类别;根据语音片段中的声学特征以及预先针对所述所属的语音片段类别建立的情感模型,确定语音片段属于各种情感状态的概率,并根据所述概率,确定语音片段所属的情感状态以便根据所述语音片段所属的情感状态,对所述待处理语音数据进行情感识别。通过本发明,能够提高语音情感识别的有效性及准确度。

    语音情感识别设备及方法

    公开(公告)号:CN102142253B

    公开(公告)日:2013-05-29

    申请号:CN201010104779.3

    申请日:2010-01-29

    Inventor: 郭庆 王彬 陆应亮

    Abstract: 本发明提供了语音情感识别设备及方法。一种语音情感识别设备,包括:情感识别单元,用于将说话者的语音的当前情感状态识别为初步的情感状态;以及置信度判断单元,用于计算初步的情感状态的置信度,并利用该置信度判断初步的情感状态是否可信,如果初步的情感状态被判断为可信,则将该初步的情感状态确定为最终的情感状态,并输出该最终的情感状态。本发明通过对语音情感状态的识别结果进行置信度判断并根据判断结果来确定最终的情感状态,能够提高语音情感状态的识别结果的准确度。

    用于识别语音情感变化的设备和方法

    公开(公告)号:CN102099853B

    公开(公告)日:2012-10-10

    申请号:CN200980127959.9

    申请日:2009-03-16

    Inventor: 陆应亮 郭庆 王彬

    CPC classification number: G10L17/26

    Abstract: 提供了一种用于从说话人的语音数据中识别说话人的语音情感变化的设备和方法,其中该方法包括以下步骤:窗口分割步骤(S110),将说话人的语音数据按窗口宽度分割成多个窗口;窗口语音情感特征计算步骤(S120),针对所述多个窗口中的每个窗口,计算语音情感特征;以及语音情感变化识别步骤(S130),通过将由至少两个连续窗口构成的窗口集的语音情感特征与存储在语音情感特征变化数据库中的多个语音情感特征变化模板中的每个模板进行比较,以找出与该窗口集的语音情感特征匹配的语音情感特征变化模板,对该窗口集识别说话人的语音情感变化。

Patent Agency Ranking