-
公开(公告)号:CN109643539A
公开(公告)日:2019-04-16
申请号:CN201780049113.2
申请日:2017-08-03
申请人: 索尼公司
IPC分类号: G10L13/02 , G10L13/033 , H04R3/00
CPC分类号: G10L13/033 , G10L13/02 , G10L13/043 , G10L25/27 , G10L25/93 , H04R3/00
摘要: 本技术涉及允许呈现语音回放的进度的状态的语音处理装置和方法。该语音处理装置设置有控制单元,该控制单元根据语音回放来控制语音输出,该语音输出在听觉上指示相对于整个语音回放的进度。该技术可以应用于语音生成进度呈现UI系统。
-
公开(公告)号:CN109147757A
公开(公告)日:2019-01-04
申请号:CN201811056146.2
申请日:2018-09-11
申请人: 广州酷狗计算机科技有限公司
发明人: 劳振锋
IPC分类号: G10L13/02 , G10L13/033
CPC分类号: G10L13/02 , G10L13/033
摘要: 本发明公开了一种歌声合成方法及装置,属于语音合成技术领域。所述方法包括:当获取到用户语音时,提取出所述用户语音中每个字的基频、包络和辅音信息;根据歌曲中每个字的音高频率,对所述用户语音中每个字的基频进行调整,所述歌曲中每个字的音高频率为所述歌曲中每个字的音高对应的频率;对调整后的基频、所述用户语音中每个字的包络和辅音信息进行合成处理,得到合成音频;根据所述歌曲中每个字的时长,对所述合成音频中每个字的时长进行调整,得到合成的用户歌声。本发明采用用户原本的包络和辅助信息合成用户歌声,可以保留用户原本的音色,合成的用户歌声与用户的声音更为接近。
-
公开(公告)号:CN109036373A
公开(公告)日:2018-12-18
申请号:CN201810857848.4
申请日:2018-07-31
申请人: 北京微播视界科技有限公司
发明人: 王丽娜
IPC分类号: G10L13/033 , G10L13/04 , G10L13/08 , G10L15/18 , G10L15/183 , G10L15/19 , G10L21/0208
CPC分类号: G10L13/033 , G10L13/043 , G10L13/08 , G10L15/1822 , G10L15/183 , G10L15/19 , G10L21/0208 , G10L2021/02087
摘要: 本申请公开了一种语音处理方法及电子设备,该方法包括:对获取的预播报信息的内容进行语义识别;根据识别结果生成与所述预播报信息相对应的背景音频及语音信息;对所述背景音频及所述语音信息进行合成操作,生成与所述预播报信息相对应的播报音频。该语音处理方法能够对背景音频及语音信息进行合成操作,使得在对语音信息进行播报的同时还能够播放背景音频,增强用户体验。
-
公开(公告)号:CN108986802A
公开(公告)日:2018-12-11
申请号:CN201810338000.0
申请日:2018-04-16
申请人: 联想(新加坡)私人有限公司
发明人: 瑞安·查尔斯·克努森 , 罗德里克·埃科尔斯
CPC分类号: G10L13/033 , G10L13/047 , G10L15/005 , G10L25/27 , G10L25/75
摘要: 一个实施方式提供了一种用于提供与方言相关联的输出的方法、设备及程序产品。该方法包括:在信息处理设备处,接收可听用户输入;使用处理器来确定与可听用户输入相关联的方言;以及基于该确定来提供与该方言相关联的输出。描述并且要求保护了其他方面。
-
公开(公告)号:CN108681529A
公开(公告)日:2018-10-19
申请号:CN201810250865.1
申请日:2018-03-26
申请人: 山东科技大学
IPC分类号: G06F17/24 , G10L13/02 , G10L13/033 , G10L13/04
CPC分类号: G06F17/241 , G10L13/02 , G10L13/033 , G10L13/04
摘要: 本发明公开了一种流程模型图的多语言文本及语音生成方法,属于流程挖掘领域。本发明首先识别流程模型图中的模型元素、模型节点文本和模型有向边,并将识别的流程模型存储为标准流程模型文件;然后使用多语言语义依存解析模型元素文本,使用RPST算法解析模型结构,使用带注释流程结构树存储模型元素文本和流程模型结构信息;然后根据文本信息数量和结构复杂度对带注释流程结构树划分,然后使用深度语法树从带注释流程结构树生成流程模型的多语言文本,最后从多语言文本生成流程模型的多语言语音。本发明能够正确的识别流程模型图中的流程模型,能够正确的解析流程模型的文本及结构,能够生成语法正确的文本和发音正确的语音。
-
公开(公告)号:CN108630213A
公开(公告)日:2018-10-09
申请号:CN201710761063.2
申请日:2017-08-30
发明人: 山本雅裕
IPC分类号: G10L21/013 , G10L21/003
CPC分类号: G10L13/08 , G10L13/033 , G10L13/04 , G10L13/10 , G10L21/003
摘要: 提供能够使利用者的注意力增强的声音处理装置、声音处理方法以及存储介质。声音处理装置具备确定部、决定部和调制部。确定部确定要输出的声音的强调部分。决定部决定多个输出部中的、要输出用于强调强调部分的声音的第1输出部及第2输出部。调制部对使第1输出部输出的第1声音及使第2输出部输出的第2声音中的至少一方的强调部分进行调制,以使得在第1声音的强调部分与第2声音的强调部分之间,音调及相位中的至少一方不同。
-
公开(公告)号:CN107833572A
公开(公告)日:2018-03-23
申请号:CN201711080690.6
申请日:2017-11-06
申请人: 芋头科技(杭州)有限公司
发明人: 孟猛
IPC分类号: G10L13/08 , G10L13/033 , G10L13/04 , G10L15/26 , G10L15/02
CPC分类号: G10L13/08 , G10L13/033 , G10L13/043 , G10L15/02 , G10L15/26
摘要: 本发明公开了一种模拟用户说话的语音合成方法及系统,属于语音合成技术领域;方法包括步骤S1,获取外部输入的一段待模拟语音;步骤S2,将待模拟语音识别为对应的包括多个顺序排列的基本音子的发音文本;步骤S3,根据待模拟语音分别处理得到发音文本中每个基本音子的发音时段信息;步骤S4,将发音文本和发音时段信息送入包括一预先训练形成的语音合成模型的语音合成器中,以得到对应于待模拟语音的合成语音并输出。系统包括语音获取单元、语音识别单元、处理单元以及合成单元。上述技术方案的有益效果是:体现语音模拟应用的音色一致性,突出应用本身的个性特点,同时提供给用户更有特色的合成语音,提升用户的使用体验。
-
公开(公告)号:CN107767857A
公开(公告)日:2018-03-06
申请号:CN201710892040.5
申请日:2017-09-27
申请人: 联想(北京)有限公司
发明人: 赵静滨
IPC分类号: G10L13/033 , G10L21/007 , G10L21/013
CPC分类号: G10L13/033 , G10L13/0335 , G10L21/007 , G10L21/013
摘要: 本发明实施例公开了一种信息播放方法,所述方法包括:获取第一特征信息;其中,所述第一特征信息是用户对第一电子设备进行操作后产生的;基于所述第一特征信息,确定第一声音模型;接收播放指令,并响应所述播放指令采用所述第一声音模型,播放预设声音信息。本发明的实施例同时还公开了一种第一电子设备。
-
公开(公告)号:CN106575500A
公开(公告)日:2017-04-19
申请号:CN201580045327.3
申请日:2015-08-28
申请人: 英特尔公司
IPC分类号: G10L13/027 , G10L13/047 , G06K9/00
CPC分类号: G10L13/027 , G06K9/00315 , G10L13/033 , G10L13/047
摘要: 所公开的是用于使用在基于发音的文本到语音转换系统中的实施例,所述系统配置成基于定义人员的话音的外部可视发音语音合成模型参数的面部特性和基于从预定义的模型的储存库之中选择的预定义的发音语音合成模型而建立人员的话音的发音语音合成模型。
-
公开(公告)号:CN106228973A
公开(公告)日:2016-12-14
申请号:CN201610573399.1
申请日:2016-07-21
申请人: 福州大学
IPC分类号: G10L13/033 , G10L19/125 , G10L25/15 , G10L25/24 , G10L25/45 , G10L25/90
CPC分类号: G10L13/033 , G10L13/0335 , G10L19/125 , G10L25/15 , G10L25/24 , G10L25/45 , G10L25/90
摘要: 本发明涉及一种稳定音色的音乐语音变调方法,利用语音信号可分为声门激励分量和声道冲激响应分量,通过语音信号的倒谱序列导出频谱包络,然后利用频谱包络分离出语音信号的激励分量,再将语音信号的激励分量通过变调算法处理改变其音高,最后将频谱包络和音高改变后的激励分量重新合成,得到音高改变但音色稳定的音乐语音信号。本发明所提出的一种稳定音色的音乐语音变调方法,该方法简单,实现灵活,具有较强的实用性。
-
-
-
-
-
-
-
-
-