-
公开(公告)号:CN101145346B
公开(公告)日:2010-10-13
申请号:CN200710146698.8
申请日:2007-08-24
Applicant: 富士通株式会社
Inventor: 松本智佳子
CPC classification number: G10L21/0364 , G10L2021/0575
Abstract: 本发明涉及语音增强设备、语音记录设备、语音增强程序、语音记录程序、语音增强方法和语音记录方法,它们可自动地检测并自动地校正与摩擦音的幅度变化有关的缺陷部分,或者与爆破音有关的缺陷部分,例如是否存在爆破音部分、在爆破音部分之后持续的送气音部分的音素长度。向根据本发明的语音增强设备中输入其中辅音和清元音不清楚且不悦耳的语音。在该语音增强设备中,语音被划分为音素,且各音素被分类为清爆破音、浊爆破音、清摩擦音、浊摩擦音、塞擦音和清元音中的任一个。根据各音素的校正必要性而校正各音素,以获得其中辅音和清元音清楚且悦耳的语音的输出。
-
公开(公告)号:CN100559469C
公开(公告)日:2009-11-11
申请号:CN200710109165.2
申请日:2007-06-14
Applicant: 富士通株式会社
CPC classification number: G10L21/04 , G10L21/003
Abstract: 本发明提供基音转换方法和设备,其可以在尽可能地抑制由于进行基音转换而导致的声音质量的劣化的同时减小数据吞吐量。在该基音转换方法和装置中,按预定处理单位接收输入信号基音模式和目标基音模式,并对表示从输入信号基音模式到目标基音模式的基音转换时输入信号的波形的劣化程度的劣化度进行计算。作为另一种选择,从一数据库中提取与输入信号的语音状态和音位类型相对应的劣化度,在该数据库中将所估计的语音状态和音位类型的所有组合与劣化度相关联以进行记录。然后,根据该劣化度在执行具有小数据吞吐量的基音转换的基音转换器与执行具有大数据吞吐量的基音转换的基音转换器之间进行切换。
-
公开(公告)号:CN101542593B
公开(公告)日:2013-04-17
申请号:CN200780043301.0
申请日:2007-03-12
Applicant: 富士通株式会社
Inventor: 松本智佳子
IPC: G10L19/097
CPC classification number: G10L19/097
Abstract: 本发明涉及一种语音波形内插装置及方法,其针对所存储的语音数据(Din)的一部分,利用该语音数据的另一部分进行内插,生成语音数据(Dc)。为此,所述语音波形内插装置具有:语音存储部(2);生成内插语音数据(Dc)的内插波形生成部(3);输出通过语音数据(Dc)将一部分替换的语音数据(Dout)的波形结合部(4);以及内插波形设定功能部(5),其判断上述语音数据的另一部分作为在内插波形生成部(3)中生成的内插语音数据(Dc)是否合适,并选择合适的语音数据。
-
公开(公告)号:CN101110216A
公开(公告)日:2008-01-23
申请号:CN200710109165.2
申请日:2007-06-14
Applicant: 富士通株式会社
CPC classification number: G10L21/04 , G10L21/003
Abstract: 本发明提供基音转换方法和设备,其可以在尽可能地抑制由于进行基音转换而导致的声音质量的劣化的同时减小数据吞吐量。在该基音转换方法和装置中,输入按预定处理单位的输入信号基音模式和目标基音模式,并对表示从输入信号基音模式到目标基音模式的基音转换时输入信号的波形的劣化程度的劣化度进行计算。作为另一种选择,从一数据库中提取与输入信号的语音状态和音位类型相对应的劣化度,在该数据库中将所估计的语音状态和音位类型的所有组合与劣化度相关联以进行记录。然后,根据该劣化度在执行具有小数据吞吐量的基音转换的基音转换器与执行具有大数据吞吐量的基音转换的基音转换器之间进行切换。
-
公开(公告)号:CN101542593A
公开(公告)日:2009-09-23
申请号:CN200780043301.0
申请日:2007-03-12
Applicant: 富士通株式会社
Inventor: 松本智佳子
CPC classification number: G10L19/097
Abstract: 本发明涉及一种语音波形内插装置及方法,其针对所存储的语音数据(Din)的一部分,利用该语音数据的另一部分进行内插,生成语音数据(Dc)。为此,所述语音波形内插装置具有:语音存储部(2);生成内插语音数据(Dc)的内插波形生成部(3);输出通过语音数据(Dc)将一部分替换的语音数据(Dout)的波形结合部(4);以及内插波形设定功能部(5),其判断上述语音数据的另一部分作为在内插波形生成部(3)中生成的内插语音数据(Dc)是否合适,并选择合适的语音数据。
-
公开(公告)号:CN101145346A
公开(公告)日:2008-03-19
申请号:CN200710146698.8
申请日:2007-08-24
Applicant: 富士通株式会社
Inventor: 松本智佳子
CPC classification number: G10L21/0364 , G10L2021/0575
Abstract: 本发明涉及语音增强设备、语音记录设备、语音增强程序、语音记录程序、语音增强方法和语音记录方法,它们可自动地检测并自动地校正与摩擦音的幅度变化有关的缺陷部分,或者与爆破音有关的缺陷部分,例如是否存在爆破音部分、在爆破音部分之后持续的送气音部分的音素长度。向根据本发明的语音增强设备中输入其中辅音和清元音不清楚且不悦耳的语音。在该语音增强设备中,语音被划分为音素,且各音素被分类为清爆破音、浊爆破音、清摩擦音、浊摩擦音、塞擦音和清元音中的任一个。根据各音素的校正必要性而校正各音素,以获得其中辅音和清元音清楚且悦耳的语音的输出。
-
-
-
-
-