-
公开(公告)号:CN110431621A
公开(公告)日:2019-11-08
申请号:CN201780088311.X
申请日:2017-09-26
Applicant: 东芝数字解决方案株式会社
IPC: G10L13/033 , G10L13/047 , G10L13/06
Abstract: 实施方式的声音合成装置具有声音合成部(10)、讲话者参数存储部(50)、可否利用判定部(60)和讲话者参数控制部(40)。声音合成部(10)能够根据与讲话者特性相关的参数的值即讲话者参数值控制合成声音的讲话者特性。讲话者参数存储部(50)存储已登记讲话者参数值。可否利用判定部(60)根据将所输入的讲话者参数值与已登记讲话者参数值分别比较的结果,判定所输入的讲话者参数值的可否利用。讲话者参数控制部(40)禁止或者限制通过所述可否利用判定部(60)被判定为不可以利用的讲话者参数值的利用。
-
公开(公告)号:CN110431546A
公开(公告)日:2019-11-08
申请号:CN201780088429.2
申请日:2017-09-25
Applicant: 株式会社东芝 , 东芝数字解决方案株式会社
IPC: G06F16/63 , G06F16/683
Abstract: 发音者检索装置(10)具备第一变换部(14B)、受理部(14C)和检索部(14D)。第一变换部(14B)使用用于将表示声质特征的得分向量变换成声学模型的第一变换模型(12B)的逆变换模型,将预先登记的声学模型变换成得分向量,并与发音者ID建立对应地登记在得分管理信息(12C)中。受理部(14C)受理得分向量的输入。检索部(14D)从得分管理信息(12C)中检索与受理的得分向量相似的发音者ID。
-
公开(公告)号:CN110431546B
公开(公告)日:2023-10-13
申请号:CN201780088429.2
申请日:2017-09-25
Applicant: 株式会社东芝 , 东芝数字解决方案株式会社
IPC: G06F16/63 , G06F16/683
Abstract: 发音者检索装置(10)具备第一变换部(14B)、受理部(14C)和检索部(14D)。第一变换部(14B)使用用于将表示声质特征的得分向量变换成声学模型的第一变换模型(12B)的逆变换模型,将预先登记的声学模型变换成得分向量,并与发音者ID建立对应地登记在得分管理信息(12C)中。受理部(14C)受理得分向量的输入。检索部(14D)从得分管理信息(12C)中检索与受理的得分向量相似的发音者ID。
-
公开(公告)号:CN109427325A
公开(公告)日:2019-03-05
申请号:CN201810971707.5
申请日:2018-08-24
Applicant: 株式会社东芝 , 东芝数字解决方案株式会社
Abstract: 一种语音合成字典分发装置,将用于执行语音合成的字典分发至终端,包括:用于语音合成字典数据库的存储装置,储存:包括说话人的声学模型并且与所述说话人的识别信息相关联的第一字典;包括使用多个说话人的声音数据生成的声学模型的第二字典;以及与第二字典一起使用的且与说话人的识别信息相关联的说话人的参数集;确定第一字典和第二字典中的哪一个将在终端中用于特定说话人的处理器;和输入输出接口,接收从终端发送的说话人的识别信息,随后基于所接收的说话人的识别信息和处理器的确定结果分发第一字典、第二字典、和第二字典的参数集中的至少一个。
-
公开(公告)号:CN109427325B
公开(公告)日:2022-11-18
申请号:CN201810971707.5
申请日:2018-08-24
Applicant: 株式会社东芝 , 东芝数字解决方案株式会社
Abstract: 一种语音合成字典分发装置,将用于执行语音合成的字典分发至终端,包括:用于语音合成字典数据库的存储装置,储存:包括说话人的声学模型并且与所述说话人的识别信息相关联的第一字典;包括使用多个说话人的声音数据生成的声学模型的第二字典;以及与第二字典一起使用的且与说话人的识别信息相关联的说话人的参数集;确定第一字典和第二字典中的哪一个将在终端中用于特定说话人的处理器;和输入输出接口,接收从终端发送的说话人的识别信息,随后基于所接收的说话人的识别信息和处理器的确定结果分发第一字典、第二字典、和第二字典的参数集中的至少一个。
-
-
-
-