-
公开(公告)号:CN105185372B
公开(公告)日:2017-03-22
申请号:CN201510684475.1
申请日:2015-10-20
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 李秀林
IPC: G10L13/02 , G10L15/02 , G10L15/183
CPC classification number: G10L13/02 , G10L13/08 , G10L15/02 , G10L15/04 , G10L15/063 , G10L15/142 , G10L15/1807 , G10L15/183 , G10L2015/0631
Abstract: 本发明公开了一种用于语音合成的个性化多声学模型的训练方法、语音合成方法及装置,其中,该方法包括:基于训练语音数据的第一声学特征数据和与训练语音数据对应的第一文本标注数据,训练基准声学模型;获取目标用户的语音数据;根据基准声学模型和语音数据,训练第一目标用户声学模型;根据第一目标用户声学模型和第一文本标注数据生成第一文本标注数据的第二声学特征数据;以及基于第一文本标注数据和第二声学特征数据,训练第二目标用户声学模型。该实施例的模型训练方法,在训练目标用户声学模型过程中,降低了对目标用户的语音数据的规模的要求,利用少量的用户语音数据就可训练出多个包含目标用户的语音特点的个性化声学模型。
-
公开(公告)号:CN105933130A
公开(公告)日:2016-09-07
申请号:CN201610258811.0
申请日:2016-04-25
Applicant: 四川联友电讯技术有限公司
Inventor: 王学宗
CPC classification number: H04L12/1822 , G10L13/08 , H04L67/26
Abstract: 本发明公开了一种碎片化异步会议系统的语音信息推送方法,包括以下步骤:S1.发言请求者通过会议APP将发言请求发送至会议云服务器;S2.对发言请求者进行角色鉴权,判断发言请求者是否有权发言:若无权发言,则会议云服务器向发言请求者返回无权发言的提示信息;否则创建发言内容的接收成员列表;S3.将发言内容发送到会议云服务器中的信息接收模块;S4.检测模块检测信息接收模块接收到的发言内容的格式类型:若接收到的发言内容为语音格式,则跳转步骤S5;若接收到的发言内容为文本格式,则将发言内容转换为语音格式;S5.将发言内容推送给接收人员列表中的全部参会成员。本发明将文本格式的发言内容转换为语音格式,然后再将会议内容推送给参会成员。
-
公开(公告)号:CN1618173B
公开(公告)日:2016-08-17
申请号:CN02827546.2
申请日:2002-06-21
Applicant: 泰吉克通讯股份有限公司
Inventor: 艾森·罗伯特·布莱德弗德 , 凯思·卡尔斯·布尔费什 , 戴维·J.·凯 , 皮姆·凡·默尔斯 , 迈克尔·R·隆志
CPC classification number: G06F17/30684 , G06F3/02 , G06F3/0233 , G06F3/0235 , G06F3/0236 , G06F3/0237 , G06F3/04842 , G06F17/30696 , G06F17/30705 , G10L13/08
Abstract: 本发明涉及了一种用于在多义性文字输入中明确过滤的方法和装置。本发明提供了包括各种明确文字输入方法的实施例,诸如2键和长时间按下。本发明还提供了用于利用环绕构造方法、词干锁定方法、单词完整化方法、和n个字符列搜索来对数据库中的单词进行匹配的装置。
-
公开(公告)号:CN105529024A
公开(公告)日:2016-04-27
申请号:CN201510667009.2
申请日:2015-10-15
Applicant: 雅马哈株式会社
Inventor: 入山达也
CPC classification number: G10L13/10 , G10H1/0066 , G10H1/46 , G10H2250/455 , G10L13/0335 , G10L13/08 , G10L13/04
Abstract: 一种音韵信息合成装置,其特征在于,具有:操作强度信息获取部,其获取表示操作强度的信息;以及音韵信息生成部,其基于从所述操作强度信息获取部供给的表示操作强度的信息,将对合成对象即歌唱语音的音韵进行指定的音韵信息输出。
-
公开(公告)号:CN105283916A
公开(公告)日:2016-01-27
申请号:CN201380077322.X
申请日:2013-06-11
Applicant: 株式会社东芝
IPC: G10L19/018
CPC classification number: G10L19/018 , G10L13/06 , G10L13/08 , G10L13/10
Abstract: 本发明的电子水印嵌入装置具备:合成声音生成部,其按照所输入的文本,输出合成声音和合成声音所包含的音素的时刻信息;推定部,其推定在上述所输入的文本中是否包含潜在风险表达,输出被推定为包含上述潜在风险表达的潜在风险区间;嵌入控制部,其通过使上述潜在风险区间与上述时刻信息相对应,来确定并输出上述合成声音中的电子水印的嵌入时刻;以及嵌入部,其对上述合成声音,在由上述合成声音的上述嵌入时刻指定的时刻的特定的频带嵌入电子水印。
-
公开(公告)号:CN105185372A
公开(公告)日:2015-12-23
申请号:CN201510684475.1
申请日:2015-10-20
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 李秀林
IPC: G10L13/02 , G10L15/02 , G10L15/183
CPC classification number: G10L13/02 , G10L13/08 , G10L15/02 , G10L15/04 , G10L15/063 , G10L15/142 , G10L15/1807 , G10L15/183 , G10L2015/0631
Abstract: 本发明公开了一种用于语音合成的个性化多声学模型的训练方法、语音合成方法及装置,其中,该方法包括:基于训练语音数据的第一声学特征数据和与训练语音数据对应的第一文本标注数据,训练基准声学模型;获取目标用户的语音数据;根据基准声学模型和语音数据,训练第一目标用户声学模型;根据第一目标用户声学模型和第一文本标注数据生成第一文本标注数据的第二声学特征数据;以及基于第一文本标注数据和第二声学特征数据,训练第二目标用户声学模型。该实施例的模型训练方法,在训练目标用户声学模型过程中,降低了对目标用户的语音数据的规模的要求,利用少量的用户语音数据就可训练出多个包含目标用户的语音特点的个性化声学模型。
-
公开(公告)号:CN104618456A
公开(公告)日:2015-05-13
申请号:CN201510015427.3
申请日:2015-01-13
Applicant: 小米科技有限责任公司
CPC classification number: H04L67/26 , G06Q30/0241 , G10L13/08
Abstract: 本公开实施例公开了一种信息发布方法及装置,所述信息发布方法由服务器首先获取用户发送的需要发布的信息,并利用TTS技术将所述需要发布的信息合成目标语音信息,然后,将所述目标语音信息推送给播放终端,以使播放终端播放所述目标语音信息。用户利用自己的移动终端向服务器发送所要发布的信息,服务器将用户发送的信息合成相应的目标语音信息,并推送给相应的播放终端,实现用户利用自己的移动终端制作所要发布的信息,不需要专门的人员制作,降低用户所要发布的信息的制作成本。而且,用户不需要专业的技术和设备,操作简单。
-
公开(公告)号:CN104536645A
公开(公告)日:2015-04-22
申请号:CN201410780334.5
申请日:2014-12-17
Applicant: 北京塞宾科技有限公司
Inventor: 张德明
IPC: G06F3/0481 , G06F3/0487 , H04M1/725 , H04L29/08
CPC classification number: G06F3/167 , G06F17/30017 , G10L13/08 , H04L67/26
Abstract: 本发明涉及一种基于云技术的信息呈现方法,其特征在于:智能终端通过互联网向云服务器发出信息获取请求,云服务器根据请求将信息内容发送至智能终端,智能终端对信息内容中的文字信息进行语音合成,并通过扬声器或耳机进行播放。
-
公开(公告)号:CN104424943A
公开(公告)日:2015-03-18
申请号:CN201410419320.0
申请日:2014-08-22
Applicant: 株式会社东芝
Inventor: 陈浪舟
Abstract: 一种训练用于文本转语音系统的声学模型的方法,所述方法包括:接收语音数据,所述语音数据包括对应于第一语音因素的不同值的数据,并且其中所述语音数据未标记,从而对于给定的语音数据项,所述第一语音因素的值未知;根据所述第一语音因素的值将所述语音数据聚簇为第一聚类集;以及估计第一参数集以使得所述声学模型能够针对所述第一语音因素的不同值适应语音;其中所述聚簇和所述第一参数估计根据共同的最大似然性准则联合执行。
-
公开(公告)号:CN104318680A
公开(公告)日:2015-01-28
申请号:CN201410445946.9
申请日:2011-03-22
Applicant: 精工爱普生株式会社
Inventor: 延谷力
Abstract: 本发明提供一种在零售商店等中能够提高外国人店员的作业效率的声音输出装置、声音输出装置的控制方法、印刷装置和安装板。本发明的声音输出装置具备:数据发送接收部(191),其取得打印数据;数据解析部(193),其对由数据发送接收部(191)取得的数据中的至少一部分数据进行解析,并变换为文本数据;语言变换部(194),其将文本数据变换为预先指定的一种以上的语言;声音合成部(195),其生成与由语言变换部(194)进行了语言变换后的文本数据对应的一种以上的合成声音数据;和声音数据输出部(196),其对耳机(104)输出由声音合成部(195)生成的一种以上的合成声音数据。
-
-
-
-
-
-
-
-
-