计算机生成的头部
    32.
    发明公开

    公开(公告)号:CN103971393A

    公开(公告)日:2014-08-06

    申请号:CN201410050837.7

    申请日:2014-01-29

    Abstract: 本发明涉及计算机生成的头部。一种动画制作计算机生成头部的方法,头部具有根据要由头部输出的语音动作的嘴部,方法包括:提供与要由嘴唇动作输出的语音相关的输入;将输入分成声音单元序列;为输入文本选择表情特性;使用统计模型将声音单元序列转换为图像矢量序列,其中模型具有描述将声音单元与图像矢量相关的概率分布的多个模型参数,图像矢量包括定义头部的脸部的多个参数;以及将图像矢量序列输出为视频,这样头部的嘴部动作以用选择的表情模仿与输入文本相关联的语音其中将选择的表情中每个概率分布的预定类型的参数表示为相同类型的参数的加权之和,并且其中所用的权重为表情相关的,其中按簇提供参数,并且每个簇包括至少一个子簇。

    发音信息生产装置、车载信息装置以及数据库生成方法

    公开(公告)号:CN103635961A

    公开(公告)日:2014-03-12

    申请号:CN201180071596.9

    申请日:2011-06-14

    Inventor: 山崎道弘

    CPC classification number: G10L13/08 G10L15/187

    Abstract: 单词串信息DB存储部(1)存储有登记了单词串的书写信息与正式发音信息的单词串信息DB。该单词串信息DB在根据书写信息自动生成的发音信息与正式发音信息一致的情况下,仅登记书写信息,在不一致的情况下,登记书写信息与正式发音信息。单词串信息检索部(2)从单词串信息DB存储部(1)获取与输入字符串相一致的单词串的信息,发音信息生成判定部(3)若判定未登记该单词串的正式发音信息,则使发音信息生成部(4)生成发音信息并进行外部输出,若判定登记有该单词串的正式发音信息,则从发音信息输出部(5)对该正式发音信息进行外部输出。

    提取文本以转换成音频

    公开(公告)号:CN102622333A

    公开(公告)日:2012-08-01

    申请号:CN201210013614.4

    申请日:2012-01-17

    Applicant: 微软公司

    CPC classification number: G06F17/2247 G06F17/227 G10L13/08

    Abstract: 本发明涉及提取文本以转换成音频。公开了涉及将标记内容转换成音频输出的各实施例。例如,所公开的一个实施例提供在计算设备中的包括如下各项的方法:将标记文档分成多个内容面板;以及通过基于每一个面板相对于标记文档的总体组织的几何准则和/或基于位置的准则来对所述多个内容面板进行过滤以形成内容面板的子集。该方法还包括:确定内容面板的该子集中的每一个内容面板的文档对象模型(DOM)分析值;通过基于内容面板的该子集中的每一个内容面板的DOM分析值来对内容面板的该子集进行过滤以标识出被确定为包含文本正文内容的内容面板的集合;以及,将在被确定为包含文本正文内容的所选内容面板中的文本转换成音频输出。

    参数语音合成方法和系统
    38.
    发明公开

    公开(公告)号:CN102270449A

    公开(公告)日:2011-12-07

    申请号:CN201110229013.2

    申请日:2011-08-10

    Inventor: 吴凤梁 职振华

    CPC classification number: G10L13/08 G10L2015/227

    Abstract: 本发明提供了一种参数语音合成方法,包括:根据对输入文本的分析获取包含上下文信息的音素序列;依次取出音素序列中的一个音素,在统计模型库中搜索该音素的各声学参数对应的统计模型,按帧取出该音素的各统计模型作为待合成语音参数的粗略值;使用滤波器组对待合成语音参数的粗略值进行参数平滑,得到平滑后的语音参数;使用全局参数优化器对平滑后的语音参数进行全局参数优化,得到优化后的语音参数;然后利用参数语音合成器进行合成,输出一帧合成语音;重复上述处理直至处理完所述音素序列中的所有音素的所有帧。利用本发明,能够使语音合成所需要的RAM不会随着合成语音长度的增加而增加,合成语音的时长不再受到RAM的限制。

    声音输出装置、声音输出装置的控制方法、印刷装置和安装板

    公开(公告)号:CN102243788A

    公开(公告)日:2011-11-16

    申请号:CN201110074022.9

    申请日:2011-03-22

    Inventor: 延谷力

    CPC classification number: B41J3/44 G10L13/00 G10L13/08 G10L15/26

    Abstract: 本发明提供一种在零售商店等中能够提高外国人店员的作业效率的声音输出装置、声音输出装置的控制方法、印刷装置和安装板。本发明的声音输出装置具备:数据发送接收部(191),其取得打印数据;数据解析部(193),其对由数据发送接收部(191)取得的数据中的至少一部分数据进行解析,并变换为文本数据;语言变换部(194),其将文本数据变换为预先指定的一种以上的语言;声音合成部(195),其生成与由语言变换部(194)进行了语言变换后的文本数据对应的一种以上的合成声音数据;和声音数据输出部(196),其对耳机(104)输出由声音合成部(195)生成的一种以上的合成声音数据。

    语音合成装置及语音合成方法

    公开(公告)号:CN101171624B

    公开(公告)日:2011-08-10

    申请号:CN200680015605.1

    申请日:2006-03-10

    Inventor: 佐藤宁

    CPC classification number: G10L13/06 G10L13/08

    Abstract: 语音片段编辑部分(5)从语音片段数据库(7)中检索关于语音片段的语音片段数据,其中该语音片段的读音与固定消息中语音片段的读音相匹配,并对该语音片段进行转换,以便于与由该发声速度数据指定的速度相匹配。该语音片段编辑部分(5)预测固定消息的韵律,并根据该韵律预测结果逐个地选择与该固定消息的每个语音片段最匹配的检索到的语音片段数据的项。但是,如果对应于该语音片段数据的被选择的项的部分语音片段没有达到预定值,则取消该选择。关于没有被选择的语音片段,将表示每个单位语音波形的波形数据提供给声音处理部分(41)。将该选择的语音片段数据与提供的波形数据互连,从而生成表示合成语音的数据。这样,就提供了一种语音合成装置,用于迅速地产生合成语音,而这种简单结构不会带来任何不舒服的感觉。

Patent Agency Ranking