基于声学统计模型的单元挑选语音合成方法

    公开(公告)号:CN101178896A

    公开(公告)日:2008-05-14

    申请号:CN200710191078.6

    申请日:2007-12-06

    IPC分类号: G10L13/02 G10L13/06 G10L13/08

    摘要: 本发明涉及基于声学统计模型的单元挑选语音合成方法,其方法包括提取训练语料库各声学特征;结合训练语料库中各句话的音段、韵律等标注信息,训练各种声学特征所对应的统计模型,在合成时通过对输入文本进行文本分析,得到待合成句子中各音素对应的各种声学特征的统计模型。以备选单元序列包含的声学参数相对于待合成句的声学统计模型具有最大的似然值为准则,搜索最优的备选单元;使用声学统计模型间的KLD来实现合成单元的快速预挑选;最终通过对各个音素的最优备选单元的波形进行平滑和拼接,得到该句话的合成语音。本发明提高合成语音音质;同时提高传统拼接合成方法的合成效果,并且可以实现系统的自动构建和语种的无关性。

    句子层面的大规模快速匹配方法

    公开(公告)号:CN101329680B

    公开(公告)日:2010-12-08

    申请号:CN200810107117.4

    申请日:2008-07-17

    IPC分类号: G06F17/30

    摘要: 本发明涉及句子层面的大规模快速匹配方法,本方法包括索引建立、模糊匹配和精确匹配三个阶段。索引建立阶段进行句子内容的标准化、编码转换;模糊匹配阶段的目的是从海量句子中挑选出可能与新句子匹配的候选句子,其数量控制在一个可行的范围内;精确匹配阶段采用了基于编辑距离的相似性衡量算法,再根据精确匹配的相似性对候选句子排序得到最终匹配的句子。本发明方法的优点是实际测试性能优异,搜索效率高、漏检率低,满足实用要求。

    一种针对计算机语言学习系统发音评测的自适应方法

    公开(公告)号:CN101315733A

    公开(公告)日:2008-12-03

    申请号:CN200810107118.9

    申请日:2008-07-17

    IPC分类号: G09B19/04 G09B19/06 G10L15/00

    摘要: 本发明涉及一种针对计算机语言学习系统发音评测的自适应方法,包括以下步骤:搭建语音识别系统;在语音识别系统基础上进行语音数据的声韵母切分和限制声韵母边界的声韵母和声调的识别;根据切分和限制边界识别的结果计算各声韵母和声调后验概率,并根据预先设定门限分别挑选出的自适应数据;根据挑选出自适应数据对识别系统中的声学模型进行自适应;用自适应后的声学模型进行第二遍切分和识别;用最终切分识别结果提取评测参数。本发明通过后验概率挑选合适的自适应语料,既能减弱由于实际发音人同标准模型音色、使用环境以及信道的差异造成的识别器误差,又能避免自适应时将标准模型拉偏,不能正确对发音人的发音进行评价。

    一种基于支持向量机进行发音错误检测的方法

    公开(公告)号:CN101231848A

    公开(公告)日:2008-07-30

    申请号:CN200710135347.7

    申请日:2007-11-06

    摘要: 本发明涉及一种基于支持向量机进行发音错误检测的方法,包括有典型错误支持向量机检测方法、异常错误门限检测方法和异常混淆错误支持向量机检测方法,包括以下步骤实现:语音识别系统的搭建、发音错误检测特征提取、获取发音错误检测模型训练目标数据、训练发音错误支持向量机检测模型和发音错误的检测、训练异常发音错误检测器、设置发音错误检测门限、定义每个音素的易混淆错误对、生成训练特征文件和目标数据、训练支持向量机模型、设置发音错误检测门限、进行异常易混淆错误判决。本发明能有效解决人工标注稀疏问题,保证了训练得到的检错模型可以较好针对不同发音人,不同发音风格进行错误检测。

    句子模板自动提取的方法

    公开(公告)号:CN101221558A

    公开(公告)日:2008-07-16

    申请号:CN200810019527.3

    申请日:2008-01-22

    IPC分类号: G06F17/27

    摘要: 本发明涉及句子模板自动提取的方法,包括以下步骤:分句:按标点符号,将文本分成若干条句子;并按先后顺序在句子前标上序号;分词:运用分词技术,将分句所得的每条句子,切分成基于每个词的小块;分词完成后,按句子中词语个数由多到少或由少到多划分成若干组;模板提取:将同一组的句子应用LCS算法,得到最长公共子序列,即得到句子模板。本发明可以从大量文本信息中,自动、高效的统计常用字词、句式。

    发音指导方法
    7.
    发明授权

    公开(公告)号:CN101105939B

    公开(公告)日:2012-07-18

    申请号:CN200710145859.1

    申请日:2007-09-04

    摘要: 本发明涉及一种发音指导方法,包括建立标准和非标准语音库;对非标准语音库中的各音素以及语音片段提供发音评价标注和语音评分标注;通过标准和非标准语音库获得非标准语音库中各音素的第一声学后验概率和音素检错阀值以及各语音片段的第一语音特征与语音评分标注之间的映射模型;获取用户发音,并根据该发音获得其各音素的第二声学后验概率以及语音片段的第二语音特征;根据该第二声学后验概率与该音素检错阀值的比较以及该第二语音特征与第一语音特征与语音评分间映射模型进行匹配,向该用户提供对其发音各音素的发音评价标注的评价内容以及语音片段的语音评分标注,让用户得知其发音中各个音素的发音是否标准以及发音中各语音片段的标准程度。

    基于声学统计模型的单元挑选语音合成方法

    公开(公告)号:CN101178896B

    公开(公告)日:2012-03-28

    申请号:CN200710191078.6

    申请日:2007-12-06

    IPC分类号: G10L13/02 G10L13/06 G10L13/08

    摘要: 本发明涉及基于声学统计模型的单元挑选语音合成方法,其方法包括提取训练语料库各声学特征;结合训练语料库中各句话的音段、韵律等标注信息,训练各种声学特征所对应的统计模型,在合成时通过对输入文本进行文本分析,得到待合成句子中各音素对应的各种声学特征的统计模型。以备选单元序列包含的声学参数相对于待合成句的声学统计模型具有最大的似然值为准则,搜索最优的备选单元;使用声学统计模型间的KLD来实现合成单元的快速预挑选;最终通过对各个音素的最优备选单元的波形进行平滑和拼接,得到该句话的合成语音。本发明提高合成语音音质;同时提高传统拼接合成方法的合成效果,并且可以实现系统的自动构建和语种的无关性。

    一种个性化歌唱语音的合成方法

    公开(公告)号:CN101308652B

    公开(公告)日:2011-06-29

    申请号:CN200810107114.0

    申请日:2008-07-17

    IPC分类号: G10L13/02 G10L13/04

    摘要: 本发明涉及一种个性化歌唱语音的合成方法,包括以下步骤:对语音的线谱频率系数进行建模,并训练得到相关的决策树模型;录制特定用户的朗读风格语音,得到该用户的线谱频率系数模型;得到简谱中的歌词上下文相关的属性集,根据决策树模型和个性化线谱频率系数模型预测出歌词对应的频谱参数和声韵母时长信息;根据简谱约定生成基频信息,并与生成的时长、频谱参数合并后,得到所有的合成参数,将这些参数输入参数化语音合成声码器,可合成出个性化的歌唱语音。本发明提供了只要对少数的韵律参数进行调整,就能合成出歌唱风格的合成语音,只要能录制一个少量的朗读风格库,就能合成出歌唱风格语音的合成方法。

    语音模糊检索方法及装置

    公开(公告)号:CN101464896A

    公开(公告)日:2009-06-24

    申请号:CN200910001164.5

    申请日:2009-01-23

    IPC分类号: G06F17/30 G10L15/00

    摘要: 本发明公开了一种语音模糊检索方法及装置,其中方法包括以下步骤:利用预置的声学模型及语言模型对获取的语音信号进行语音识别,得到识别结果;利用预置的索引表根据所述识别结果在预置的文本条目库中进行检索,得到初选条目;将所述初选条目与所述识别结果进行字符串模糊匹配,选取匹配度在预置的匹配度阈值范围内的条目作为精选条目,同时记录各条目的匹配位置;计算精选条目匹配部分文本与所述语音信号间的后验概率,最终利用后验概率以及通过所述匹配位置得到的匹配比例选择若干个条目作为语音信号的检索结果。采用本发明,可实现基于语音信号在海量文本条目库上的快速准确检索到与语音信号相匹配的文本条目。