-
公开(公告)号:CN104078038A
公开(公告)日:2014-10-01
申请号:CN201310104807.5
申请日:2013-03-28
Applicant: 腾讯科技(深圳)有限公司
CPC classification number: G10L13/08
Abstract: 本发明公开了一种页面内容朗读方法和装置:获取用户请求浏览的页面内容,并确定页面内容的格式是否符合预定要求;如果是,则将页面内容展示给用户,并在当接收到用户的朗读请求时,将页面内容处理成适合朗读的形式,并将处理后的页面内容朗读出来;如果否,则在将页面内容转换为符合预定要求的格式后,展示给用户,并在当接收到用户的朗读请求时,将页面内容处理成适合朗读的形式,并将处理后的页面内容朗读出来。本发明所述方案具有广泛适用性,并能够降低实现成本。
-
公开(公告)号:CN103971393A
公开(公告)日:2014-08-06
申请号:CN201410050837.7
申请日:2014-01-29
Applicant: 株式会社东芝
Inventor: J·拉多勒-马丁内兹 , V·P·L·万 , B·斯腾格尔 , R·安德森 , R·滋波拉
CPC classification number: G06T13/80 , G06T13/205 , G10L13/08 , G10L21/10 , G10L25/63 , G10L2021/105
Abstract: 本发明涉及计算机生成的头部。一种动画制作计算机生成头部的方法,头部具有根据要由头部输出的语音动作的嘴部,方法包括:提供与要由嘴唇动作输出的语音相关的输入;将输入分成声音单元序列;为输入文本选择表情特性;使用统计模型将声音单元序列转换为图像矢量序列,其中模型具有描述将声音单元与图像矢量相关的概率分布的多个模型参数,图像矢量包括定义头部的脸部的多个参数;以及将图像矢量序列输出为视频,这样头部的嘴部动作以用选择的表情模仿与输入文本相关联的语音其中将选择的表情中每个概率分布的预定类型的参数表示为相同类型的参数的加权之和,并且其中所用的权重为表情相关的,其中按簇提供参数,并且每个簇包括至少一个子簇。
-
公开(公告)号:CN103635961A
公开(公告)日:2014-03-12
申请号:CN201180071596.9
申请日:2011-06-14
Applicant: 三菱电机株式会社
Inventor: 山崎道弘
CPC classification number: G10L13/08 , G10L15/187
Abstract: 单词串信息DB存储部(1)存储有登记了单词串的书写信息与正式发音信息的单词串信息DB。该单词串信息DB在根据书写信息自动生成的发音信息与正式发音信息一致的情况下,仅登记书写信息,在不一致的情况下,登记书写信息与正式发音信息。单词串信息检索部(2)从单词串信息DB存储部(1)获取与输入字符串相一致的单词串的信息,发音信息生成判定部(3)若判定未登记该单词串的正式发音信息,则使发音信息生成部(4)生成发音信息并进行外部输出,若判定登记有该单词串的正式发音信息,则从发音信息输出部(5)对该正式发音信息进行外部输出。
-
公开(公告)号:CN103514874A
公开(公告)日:2014-01-15
申请号:CN201310261608.5
申请日:2013-06-27
Applicant: 雅马哈株式会社
IPC: G10L13/02
CPC classification number: G10L13/04 , G10H7/02 , G10H7/12 , G10H2210/325 , G10H2220/011 , G10H2220/126 , G10H2240/145 , G10H2250/455 , G10L13/0335 , G10L13/08
Abstract: 本发明公开了一种声音合成方法和声音合成设备。该声音合成设备连接到显示装置并包括处理器,该处理器被配置成:在显示装置的屏幕上显示歌词;在屏幕上显示出歌词之后,输入基于用户的操作的音高;以及基于输入的音高来输出代表显示的歌词的歌声的一条波形数据。
-
公开(公告)号:CN101727904B
公开(公告)日:2013-04-24
申请号:CN200810174628.8
申请日:2008-10-31
Applicant: 国际商业机器公司
CPC classification number: G06F17/289 , G06F17/27 , G10L13/033 , G10L13/08 , G10L21/00
Abstract: 提出了一种语音翻译方法,该方法包括:接收源语音;提取源语音中的非文字信息;将源语音翻译为目标语音;以及根据所述提取的非文字信息调整所述翻译的目标语音,从而使得最终的目标语音中保留所述源语音中的非文字信息。
-
公开(公告)号:CN102792320A
公开(公告)日:2012-11-21
申请号:CN201180013559.2
申请日:2011-01-11
Applicant: 苹果公司
Inventor: 托马斯·罗伯特·格鲁伯 , 亚当·约翰·奇也 , 戴格·吉特劳斯 , 迪迪埃·勒内·古佐尼 , 克里斯托弗·迪安·布里格姆 , 理查德·唐纳德·朱利 , 马尔切洛·巴斯泰亚-福特 , 亨利·约瑟夫·萨德勒
IPC: G06Q10/00
CPC classification number: G10L15/1815 , B60K35/00 , G06F3/167 , G06F9/54 , G06F17/2765 , G06F17/2785 , G06F17/28 , G06F17/30654 , G06F17/30684 , G06F17/3087 , G10L13/00 , G10L13/02 , G10L13/08 , G10L15/1822 , G10L15/183 , G10L15/22 , G10L15/26 , G10L15/265 , G10L21/06 , H04M1/6091 , H04M1/72547 , H04M1/72563 , H04M1/72597
Abstract: 一种智能自动化助理系统使用自然语言对话以整合的谈话方式与用户接洽,且在适当时调用外部服务以获得信息或执行各种动作。可使用若干不同平台中的任一种来实施所述系统,例如所述平台为网络、电子邮件、智能电话等,或其任一组合。在一项实施例中,所述系统是基于若干互相联系的域和任务集合,且使用由可与所述系统交互的外部服务支持的额外功能性。
-
公开(公告)号:CN102622333A
公开(公告)日:2012-08-01
申请号:CN201210013614.4
申请日:2012-01-17
Applicant: 微软公司
CPC classification number: G06F17/2247 , G06F17/227 , G10L13/08
Abstract: 本发明涉及提取文本以转换成音频。公开了涉及将标记内容转换成音频输出的各实施例。例如,所公开的一个实施例提供在计算设备中的包括如下各项的方法:将标记文档分成多个内容面板;以及通过基于每一个面板相对于标记文档的总体组织的几何准则和/或基于位置的准则来对所述多个内容面板进行过滤以形成内容面板的子集。该方法还包括:确定内容面板的该子集中的每一个内容面板的文档对象模型(DOM)分析值;通过基于内容面板的该子集中的每一个内容面板的DOM分析值来对内容面板的该子集进行过滤以标识出被确定为包含文本正文内容的内容面板的集合;以及,将在被确定为包含文本正文内容的所选内容面板中的文本转换成音频输出。
-
公开(公告)号:CN102270449A
公开(公告)日:2011-12-07
申请号:CN201110229013.2
申请日:2011-08-10
Applicant: 歌尔声学股份有限公司
CPC classification number: G10L13/08 , G10L2015/227
Abstract: 本发明提供了一种参数语音合成方法,包括:根据对输入文本的分析获取包含上下文信息的音素序列;依次取出音素序列中的一个音素,在统计模型库中搜索该音素的各声学参数对应的统计模型,按帧取出该音素的各统计模型作为待合成语音参数的粗略值;使用滤波器组对待合成语音参数的粗略值进行参数平滑,得到平滑后的语音参数;使用全局参数优化器对平滑后的语音参数进行全局参数优化,得到优化后的语音参数;然后利用参数语音合成器进行合成,输出一帧合成语音;重复上述处理直至处理完所述音素序列中的所有音素的所有帧。利用本发明,能够使语音合成所需要的RAM不会随着合成语音长度的增加而增加,合成语音的时长不再受到RAM的限制。
-
公开(公告)号:CN102243788A
公开(公告)日:2011-11-16
申请号:CN201110074022.9
申请日:2011-03-22
Applicant: 精工爱普生株式会社
Inventor: 延谷力
Abstract: 本发明提供一种在零售商店等中能够提高外国人店员的作业效率的声音输出装置、声音输出装置的控制方法、印刷装置和安装板。本发明的声音输出装置具备:数据发送接收部(191),其取得打印数据;数据解析部(193),其对由数据发送接收部(191)取得的数据中的至少一部分数据进行解析,并变换为文本数据;语言变换部(194),其将文本数据变换为预先指定的一种以上的语言;声音合成部(195),其生成与由语言变换部(194)进行了语言变换后的文本数据对应的一种以上的合成声音数据;和声音数据输出部(196),其对耳机(104)输出由声音合成部(195)生成的一种以上的合成声音数据。
-
公开(公告)号:CN101171624B
公开(公告)日:2011-08-10
申请号:CN200680015605.1
申请日:2006-03-10
Applicant: 株式会社建伍
Inventor: 佐藤宁
Abstract: 语音片段编辑部分(5)从语音片段数据库(7)中检索关于语音片段的语音片段数据,其中该语音片段的读音与固定消息中语音片段的读音相匹配,并对该语音片段进行转换,以便于与由该发声速度数据指定的速度相匹配。该语音片段编辑部分(5)预测固定消息的韵律,并根据该韵律预测结果逐个地选择与该固定消息的每个语音片段最匹配的检索到的语音片段数据的项。但是,如果对应于该语音片段数据的被选择的项的部分语音片段没有达到预定值,则取消该选择。关于没有被选择的语音片段,将表示每个单位语音波形的波形数据提供给声音处理部分(41)。将该选择的语音片段数据与提供的波形数据互连,从而生成表示合成语音的数据。这样,就提供了一种语音合成装置,用于迅速地产生合成语音,而这种简单结构不会带来任何不舒服的感觉。
-
-
-
-
-
-
-
-
-