个性化多声学模型的训练方法、语音合成方法及装置

    公开(公告)号:CN105185372B

    公开(公告)日:2017-03-22

    申请号:CN201510684475.1

    申请日:2015-10-20

    Inventor: 李秀林

    Abstract: 本发明公开了一种用于语音合成的个性化多声学模型的训练方法、语音合成方法及装置,其中,该方法包括:基于训练语音数据的第一声学特征数据和与训练语音数据对应的第一文本标注数据,训练基准声学模型;获取目标用户的语音数据;根据基准声学模型和语音数据,训练第一目标用户声学模型;根据第一目标用户声学模型和第一文本标注数据生成第一文本标注数据的第二声学特征数据;以及基于第一文本标注数据和第二声学特征数据,训练第二目标用户声学模型。该实施例的模型训练方法,在训练目标用户声学模型过程中,降低了对目标用户的语音数据的规模的要求,利用少量的用户语音数据就可训练出多个包含目标用户的语音特点的个性化声学模型。

    碎片化异步会议系统的语音信息推送方法

    公开(公告)号:CN105933130A

    公开(公告)日:2016-09-07

    申请号:CN201610258811.0

    申请日:2016-04-25

    Inventor: 王学宗

    CPC classification number: H04L12/1822 G10L13/08 H04L67/26

    Abstract: 本发明公开了一种碎片化异步会议系统的语音信息推送方法,包括以下步骤:S1.发言请求者通过会议APP将发言请求发送至会议云服务器;S2.对发言请求者进行角色鉴权,判断发言请求者是否有权发言:若无权发言,则会议云服务器向发言请求者返回无权发言的提示信息;否则创建发言内容的接收成员列表;S3.将发言内容发送到会议云服务器中的信息接收模块;S4.检测模块检测信息接收模块接收到的发言内容的格式类型:若接收到的发言内容为语音格式,则跳转步骤S5;若接收到的发言内容为文本格式,则将发言内容转换为语音格式;S5.将发言内容推送给接收人员列表中的全部参会成员。本发明将文本格式的发言内容转换为语音格式,然后再将会议内容推送给参会成员。

    电子水印嵌入装置、电子水印嵌入方法及电子水印嵌入程序

    公开(公告)号:CN105283916A

    公开(公告)日:2016-01-27

    申请号:CN201380077322.X

    申请日:2013-06-11

    CPC classification number: G10L19/018 G10L13/06 G10L13/08 G10L13/10

    Abstract: 本发明的电子水印嵌入装置具备:合成声音生成部,其按照所输入的文本,输出合成声音和合成声音所包含的音素的时刻信息;推定部,其推定在上述所输入的文本中是否包含潜在风险表达,输出被推定为包含上述潜在风险表达的潜在风险区间;嵌入控制部,其通过使上述潜在风险区间与上述时刻信息相对应,来确定并输出上述合成声音中的电子水印的嵌入时刻;以及嵌入部,其对上述合成声音,在由上述合成声音的上述嵌入时刻指定的时刻的特定的频带嵌入电子水印。

    个性化多声学模型的训练方法、语音合成方法及装置

    公开(公告)号:CN105185372A

    公开(公告)日:2015-12-23

    申请号:CN201510684475.1

    申请日:2015-10-20

    Inventor: 李秀林

    Abstract: 本发明公开了一种用于语音合成的个性化多声学模型的训练方法、语音合成方法及装置,其中,该方法包括:基于训练语音数据的第一声学特征数据和与训练语音数据对应的第一文本标注数据,训练基准声学模型;获取目标用户的语音数据;根据基准声学模型和语音数据,训练第一目标用户声学模型;根据第一目标用户声学模型和第一文本标注数据生成第一文本标注数据的第二声学特征数据;以及基于第一文本标注数据和第二声学特征数据,训练第二目标用户声学模型。该实施例的模型训练方法,在训练目标用户声学模型过程中,降低了对目标用户的语音数据的规模的要求,利用少量的用户语音数据就可训练出多个包含目标用户的语音特点的个性化声学模型。

    信息发布方法及装置
    87.
    发明公开

    公开(公告)号:CN104618456A

    公开(公告)日:2015-05-13

    申请号:CN201510015427.3

    申请日:2015-01-13

    CPC classification number: H04L67/26 G06Q30/0241 G10L13/08

    Abstract: 本公开实施例公开了一种信息发布方法及装置,所述信息发布方法由服务器首先获取用户发送的需要发布的信息,并利用TTS技术将所述需要发布的信息合成目标语音信息,然后,将所述目标语音信息推送给播放终端,以使播放终端播放所述目标语音信息。用户利用自己的移动终端向服务器发送所要发布的信息,服务器将用户发送的信息合成相应的目标语音信息,并推送给相应的播放终端,实现用户利用自己的移动终端制作所要发布的信息,不需要专门的人员制作,降低用户所要发布的信息的制作成本。而且,用户不需要专业的技术和设备,操作简单。

    语音处理系统和方法
    89.
    发明公开

    公开(公告)号:CN104424943A

    公开(公告)日:2015-03-18

    申请号:CN201410419320.0

    申请日:2014-08-22

    Inventor: 陈浪舟

    CPC classification number: G10L13/08 G10L13/02 G10L13/10 G10L15/06

    Abstract: 一种训练用于文本转语音系统的声学模型的方法,所述方法包括:接收语音数据,所述语音数据包括对应于第一语音因素的不同值的数据,并且其中所述语音数据未标记,从而对于给定的语音数据项,所述第一语音因素的值未知;根据所述第一语音因素的值将所述语音数据聚簇为第一聚类集;以及估计第一参数集以使得所述声学模型能够针对所述第一语音因素的不同值适应语音;其中所述聚簇和所述第一参数估计根据共同的最大似然性准则联合执行。

    印刷装置及其控制方法
    90.
    发明公开

    公开(公告)号:CN104318680A

    公开(公告)日:2015-01-28

    申请号:CN201410445946.9

    申请日:2011-03-22

    Inventor: 延谷力

    CPC classification number: B41J3/44 G10L13/00 G10L13/08 G10L15/26

    Abstract: 本发明提供一种在零售商店等中能够提高外国人店员的作业效率的声音输出装置、声音输出装置的控制方法、印刷装置和安装板。本发明的声音输出装置具备:数据发送接收部(191),其取得打印数据;数据解析部(193),其对由数据发送接收部(191)取得的数据中的至少一部分数据进行解析,并变换为文本数据;语言变换部(194),其将文本数据变换为预先指定的一种以上的语言;声音合成部(195),其生成与由语言变换部(194)进行了语言变换后的文本数据对应的一种以上的合成声音数据;和声音数据输出部(196),其对耳机(104)输出由声音合成部(195)生成的一种以上的合成声音数据。

Patent Agency Ranking