-
公开(公告)号:CN110431546B
公开(公告)日:2023-10-13
申请号:CN201780088429.2
申请日:2017-09-25
Applicant: 株式会社东芝 , 东芝数字解决方案株式会社
IPC: G06F16/63 , G06F16/683
Abstract: 发音者检索装置(10)具备第一变换部(14B)、受理部(14C)和检索部(14D)。第一变换部(14B)使用用于将表示声质特征的得分向量变换成声学模型的第一变换模型(12B)的逆变换模型,将预先登记的声学模型变换成得分向量,并与发音者ID建立对应地登记在得分管理信息(12C)中。受理部(14C)受理得分向量的输入。检索部(14D)从得分管理信息(12C)中检索与受理的得分向量相似的发音者ID。
-
公开(公告)号:CN109427325A
公开(公告)日:2019-03-05
申请号:CN201810971707.5
申请日:2018-08-24
Applicant: 株式会社东芝 , 东芝数字解决方案株式会社
Abstract: 一种语音合成字典分发装置,将用于执行语音合成的字典分发至终端,包括:用于语音合成字典数据库的存储装置,储存:包括说话人的声学模型并且与所述说话人的识别信息相关联的第一字典;包括使用多个说话人的声音数据生成的声学模型的第二字典;以及与第二字典一起使用的且与说话人的识别信息相关联的说话人的参数集;确定第一字典和第二字典中的哪一个将在终端中用于特定说话人的处理器;和输入输出接口,接收从终端发送的说话人的识别信息,随后基于所接收的说话人的识别信息和处理器的确定结果分发第一字典、第二字典、和第二字典的参数集中的至少一个。
-
公开(公告)号:CN103632662A
公开(公告)日:2014-03-12
申请号:CN201310364756.X
申请日:2013-08-20
Applicant: 株式会社东芝
IPC: G10L13/08
Abstract: 提供能容易编辑韵律的韵律编辑装置、方法及程序。本实施方式涉及的韵律编辑装置包括:第1选择部、存纳部、检索部、标准化部、映射部、显示部、第2选择部、恢复部及置换部。存纳部对应存纳表示短语相关的属性的属性信息、和1个以上的韵律图形,上述韵律图形表示该短语的韵律的型式,并且表示该短语的韵律的参数包含该短语的音素数以上的要素数。检索部从存纳部检索选择短语和属性信息相一致的1个以上的韵律图形,得到韵律图形集合。映射部将标准化的韵律图形分别映射在数目比要素数少的坐标中表示的低维度空间,生成映射坐标。恢复部按照选择坐标而恢复韵律图形,得到恢复韵律图形。置换部根据选择短语将生成的合成语音的韵律置换为恢复韵律图形。
-
公开(公告)号:CN103021402A
公开(公告)日:2013-04-03
申请号:CN201210058572.6
申请日:2012-03-07
Applicant: 株式会社东芝
IPC: G10L13/02
Abstract: 本发明的实施方式涉及合成字典制作装置及合成字典制作方法。提高声音合成字典的制作效率。合成字典制作装置具备提示单元、录制单元、要否判断单元、字典制作单元和声音合成单元。提示单元向用户提示从上述句子存储单元存储的上述N个(N是自然数,N≥2)句子依次选择的第1句子。录制单元将朗读上述第1句子的用户的声音录制,将该录制波形与上述第1句子相关联存储。要否判断单元,在上述录制单元中存储M个(M是自然数,1≤M<N)上述第1句子的录制波形的状态下,判断要否制作声音合成字典。字典制作单元,在判断需要声音合成字典的制作的场合,制作声音合成字典。声音合成单元,采用由上述字典制作单元制作的声音合成字典,将第2句子变换为合成波形。
-
公开(公告)号:CN103020019A
公开(公告)日:2013-04-03
申请号:CN201210364039.2
申请日:2012-09-26
Applicant: 株式会社东芝
CPC classification number: G06F17/218 , G10L13/04 , G10L13/10 , G10L25/63
Abstract: 本发明涉及标记辅助设备、方法和程序。根据一个实施例,一种标记辅助设备(200)包括获取单元(205)、第一计算单元(208)、检测单元(207)和展示单元(210)。所述获取单元(205)获取各个标签的特征量,每个标签被用于控制标记文本的文本转语音处理。所述第一计算单元(208)针对各个字符串计算在标记文本中被分配给所述字符串的所述标签的特征量的方差。所述检测单元(207)检测被分配有第一标签的第一字符串作为包括要被修正的标签的第一候选项,所述第一标签具有不小于第一阈值的方差。所述展示单元(210)展示所述第一候选项。
-
公开(公告)号:CN101131818A
公开(公告)日:2008-02-27
申请号:CN200710149423.X
申请日:2007-07-31
Applicant: 株式会社东芝
CPC classification number: G10L13/06
Abstract: 一种语音合成装置和方法,其中所述语音合成装置包括:语音单元语料库,存储一组语音单元;选择单元,将目标语音的音素序列划分为多个片段,并从语音单元语料库中为每一片段选择语音单元的组合;评估单元,评估在目标语音与通过融合每一片段的所述组合的每一个语音单元所生成的合成语音之间的失真;选择单元,基于所述失真为每一片段递归地选择语音单元的组合;融合单元,通过对为每一片段所选出的组合的每一个语音单元进行融合来为每一片段生成新的语音单元;以及连接单元,通过连接每一片段的新的语音单元来生成合成语音。
-
-
-
-
-