-
公开(公告)号:CN105122351A
公开(公告)日:2015-12-02
申请号:CN201380070775.X
申请日:2013-01-18
Applicant: 株式会社东芝
IPC: G10L13/02 , G10L19/018
CPC classification number: G10L19/018 , G10L13/02 , G10L13/033 , G10L19/012
Abstract: 本发明提供能够在不会使合成声音的音质劣化的情况下插入电子水印的声音合成装置、电子水印信息检测装置、声音合成方法、电子水印信息检测方法、声音合成程序及电子水印信息检测程序。实施方式的信息处理装置具备声源生成部、相位调制部、声道过滤部。声源生成部使用声音的基本频率序列及脉冲信号,生成声源信号。相位调制部对声源生成部所生成的声源信号,基于电子水印信息,按每个音高标记调制脉冲信号的相位。声道过滤部对相位调制部调制了脉冲信号的相位后的声源信号,使用频谱参数序列生成声音信号。
-
公开(公告)号:CN104464718A
公开(公告)日:2015-03-25
申请号:CN201410458186.5
申请日:2014-09-10
Applicant: 株式会社东芝
IPC: G10L13/08
CPC classification number: G10L13/033 , G10L13/10
Abstract: 根据一个实施例,一种韵律编辑装置包括近似轨迹生成器、设置器、显示控制器、操作接收器和更新器。所述近似轨迹生成器用包括控制点的参数曲线近似表示韵律信息的时间序列的轨迹,以生成近似轨迹。所述设置器在所述近似轨迹上设置与所述控制点对应的操作点。所述显示控制器在显示装置上显示操作屏幕,所述操作屏幕包括在其上显示所述操作点的所述近似轨迹。所述操作接收器接收在所述操作屏幕上移动任意选择的操作点的操作。所述更新器根据所述操作点的移动量计算所述控制点的位置,并更新所述近似轨迹。
-
公开(公告)号:CN104169912A
公开(公告)日:2014-11-26
申请号:CN201380005184.4
申请日:2013-03-12
Applicant: 株式会社东芝
IPC: G06F17/30
CPC classification number: G06F17/30684 , G06F17/241 , G06F17/30675
Abstract: 根据一个实施例,信息处理终端包括生成器、获取单元、和输出单元。生成器分析电子文档以生成包括该电子文档中的文本信息和关于该电子文档的结构信息的元数据项。获取单元将该元数据项传送至信息管理设备,使得信息管理设备估算类似于该元数据项的相似元数据项并获取对应于该相似元数据项的注解信息项。输出单元输出与电子文档相关的注解信息项。
-
公开(公告)号:CN103020105A
公开(公告)日:2013-04-03
申请号:CN201210365742.5
申请日:2012-09-27
Applicant: 株式会社东芝
CPC classification number: G10L13/027 , G09B5/062 , G09B21/006 , G10L13/08
Abstract: 本发明涉及文档读出支持设备和方法。根据一个实施例,提供了一种文档读出支持设备,具有第一到第三获取单元(11、12、14)、提取单元(13、确定单元(16)和用户验证单元(17)。第一获取单元(11)获取具有文本的文档。第二获取单元(12)获取具有定义的元数据,每个定义包括适用条件和读出方式。提取单元(13)提取文档的特征。第三获取单元(14)获取执行环境信息。确定单元(16)基于该特征和信息确定读出的参数候选项。用户验证单元(17)展示候选项并接收验证指令。
-
公开(公告)号:CN113724685B
公开(公告)日:2024-04-02
申请号:CN202111029334.8
申请日:2015-09-16
Applicant: 株式会社东芝
IPC: G10L13/033 , G10L13/10 , G10L15/14
Abstract: 本发明的实施方式涉及语音合成模型学习装置、语音合成模型学习方法以及存储介质,能够防止语音劣化和不自然的音素持续长度。实施方式的语音合成模型学习装置,具有:语音语料库存储部,其存储语音数据和所述语音数据的基音标记信息及上下文信息;分析部,其根据所述语音数据,分析基音标记信息的各基音标记时刻的音响特征参数;以及统计模型学习部,其根据所述分析部分析出的音响特征参数,学习包含音响特征参数的输出分布以及基于时刻参数的持续时间长度分布的具有多个状态的统计模型,所述音响特征参数包含基音特征参数。
-
公开(公告)号:CN107924686B
公开(公告)日:2022-07-26
申请号:CN201580082452.1
申请日:2015-09-16
Applicant: 株式会社东芝
Abstract: 不仅能够使波形的再现性提高而且能够高速地生成波形。实施方式的语音处理装置具有频谱参数算出部、相位谱算出部、群延迟谱算出部、频带群延迟参数算出部以及频带群延迟修正参数算出部。频谱参数算出部算出频谱参数。相位谱算出部算出第1相位谱。群延迟谱算出部基于第1相位谱的频率成分,根据第1相位谱算出群延迟谱。频带群延迟参数算出部根据群延迟谱算出预定频率范围中的频带群延迟参数。频带群延迟修正参数算出部算出对根据频带群延迟参数重新构建所得到的第2相位谱与第1相位谱之差进行修正的频带群延迟修正参数。
-
公开(公告)号:CN114694632A
公开(公告)日:2022-07-01
申请号:CN202210403587.5
申请日:2015-09-16
Applicant: 株式会社东芝
IPC: G10L13/047 , G10L13/06 , G10L25/18
Abstract: 能使波形的再现性提高且能高速生成波形。语音处理装置具有:存储部,存储对相移后的脉冲信号进行频带分割得到的相移频带脉冲信号;延迟时间算出部,根据从各时刻的语音帧的相位谱算出的群延迟谱的预定频率范围中的频带群延迟参数算出相移频带脉冲信号的延迟时间;相位算出部,根据频带群延迟参数及从频带群延迟参数生成的对相位信息进行修正的频带群延迟修正参数算出边界频率的相位;选择部,基于所算出的各频带的相位从存储部选择对应的相移频带脉冲信号;叠加部,通过使所选择的相移频带脉冲信号按照延迟时间延迟并叠加,生成相移后的声源信号;及声道滤波部,应用与针对输入语音的各语音帧算出的频谱参数对应的声道滤波器输出语音波形。
-
公开(公告)号:CN114464208A
公开(公告)日:2022-05-10
申请号:CN202210141126.5
申请日:2015-09-16
Applicant: 株式会社东芝
IPC: G10L21/10 , G10L13/033 , G10L19/02
Abstract: 不仅能够使波形的再现性提高而且能够高速地生成波形。实施方式的语音处理装置具有:振幅信息生成部,其基于针对输入语音的各语音帧所算出的频谱参数序列,生成振幅信息;相位信息生成部,其根据从所述各语音帧的相位谱所算出的群延迟谱的预定频率范围中的频带群延迟参数序列、和对从所述频带群延迟参数序列所生成的相位谱与所述各语音帧的相位谱之差进行修正的频带群延迟修正参数序列,生成相位信息;以及语音波形生成部,其在由作为各参数的时刻信息的参数序列时刻信息所确定的各时刻,根据所述振幅信息及所述相位信息生成语音波形。
-
公开(公告)号:CN110431546A
公开(公告)日:2019-11-08
申请号:CN201780088429.2
申请日:2017-09-25
Applicant: 株式会社东芝 , 东芝数字解决方案株式会社
IPC: G06F16/63 , G06F16/683
Abstract: 发音者检索装置(10)具备第一变换部(14B)、受理部(14C)和检索部(14D)。第一变换部(14B)使用用于将表示声质特征的得分向量变换成声学模型的第一变换模型(12B)的逆变换模型,将预先登记的声学模型变换成得分向量,并与发音者ID建立对应地登记在得分管理信息(12C)中。受理部(14C)受理得分向量的输入。检索部(14D)从得分管理信息(12C)中检索与受理的得分向量相似的发音者ID。
-
公开(公告)号:CN103594082A
公开(公告)日:2014-02-19
申请号:CN201310357397.5
申请日:2013-08-16
Applicant: 株式会社东芝
IPC: G10L13/10
Abstract: 本发明涉及声音合成装置、方法及存储介质,能生成具有多样的韵律特征的合成音且也能保持对象谈话者特质。具备对输入的文本进行解析并输出语言信息的文本解析部、存储对象谈话者的第1韵律控制词典以及1个或多个基准谈话者的第2韵律控制词典的词典存储部、基于语言信息利用第1韵律控制词典生成第1韵律参数并分别利用第2韵律控制词典生成1个或多个第2韵律参数的韵律参数生成部、基于标准化参数分别对1个或多个第2韵律参数进行标准化处理的标准化部、基于权重信息对第1韵律参数及标准化处理后的1个或多个第2韵律参数进行内插处理生成第3韵律参数的韵律参数内插部和按照第3韵律参数生成合成声音的声音合成部。
-
-
-
-
-
-
-
-
-