-
公开(公告)号:CN109686358A
公开(公告)日:2019-04-26
申请号:CN201811584612.4
申请日:2018-12-24
Applicant: 广州九四智能科技有限公司
Abstract: 本发明公开了一种高保真的智能客服语音合成方法,包括:进行语音的录制;建立初始语料库;对录制好的语音进行强制对齐;进行语音切割得到三音子模型;利用三音子模型形成目标语料库;对于切割好的三音子基元计算似然;建立三音子决策树;根据所需合成文本选择合适的三音子基元;对选择的三音子基元,针对原始语音波形做基音同步标注;对原始语音波形的基音曲线与目标基音曲线建立映射,得到短时合成信号序列;将短时信号序列与目标基音周期同步排列,重叠相加得到拼接合成的语音;将合成的语音插入到提前录制好的语音中。本发明不必让客服人员录制大量重复类似的含有变量的语音,能够降低语音录制成本,还能提升整个对话过程的流畅性与自然度。
-
公开(公告)号:CN109660446A
公开(公告)日:2019-04-19
申请号:CN201811286723.7
申请日:2018-10-31
Applicant: 深圳壹账通智能科技有限公司
Inventor: 李岩
CPC classification number: H04L51/046 , G10L13/08 , H04L51/066 , H04M1/72558
Abstract: 本发明提供了一种聊天信息的语音播报方法、装置、计算机设备以及存储介质,涉及通信技术领域,其中方法包括:当检测到开启语音播报功能时,获得与在即时通信软件的聊天界面中显示的聊天消息相对应的聊天消息信息、聊天消息ID并添加在播报消息队列中;从播报队列中获取聊天消息信息进行语音播报处理;当检测到启动返回聊天功能或停止语音播报功能时,获得与当前进行语音播报处理的聊天消息信息相对应的聊天消息ID,将此聊天消息ID传回即时通信软件。本发明的方法、装置、计算机设备以及存储介质,使用户做其它事情期间,也可以获得即时通信工具的聊天信息,避免了用户在做其它事情的期间中因查看聊天消息而带来的安全隐患,提高使用感受度。
-
公开(公告)号:CN109036373A
公开(公告)日:2018-12-18
申请号:CN201810857848.4
申请日:2018-07-31
Applicant: 北京微播视界科技有限公司
Inventor: 王丽娜
IPC: G10L13/033 , G10L13/04 , G10L13/08 , G10L15/18 , G10L15/183 , G10L15/19 , G10L21/0208
CPC classification number: G10L13/033 , G10L13/043 , G10L13/08 , G10L15/1822 , G10L15/183 , G10L15/19 , G10L21/0208 , G10L2021/02087
Abstract: 本申请公开了一种语音处理方法及电子设备,该方法包括:对获取的预播报信息的内容进行语义识别;根据识别结果生成与所述预播报信息相对应的背景音频及语音信息;对所述背景音频及所述语音信息进行合成操作,生成与所述预播报信息相对应的播报音频。该语音处理方法能够对背景音频及语音信息进行合成操作,使得在对语音信息进行播报的同时还能够播放背景音频,增强用户体验。
-
公开(公告)号:CN109036372A
公开(公告)日:2018-12-18
申请号:CN201810971540.2
申请日:2018-08-24
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种语音播报方法、装置及系统,由服务端确定待播报文本中所包含的角色,及每一角色对应的文本内容,进一步为每一角色确定了对应的发声终端,通过向发声终端发送播报指令,可以使得发声终端以语音形式播报对应角色的文本内容,本申请通过将待播报文本按照角色划分对应的文本内容,并使用角色对应的发声终端对角色的文本内容进行播报,类似于话剧表演过程,更加便于用户对待播报文本内容的理解,且趣味性更强,提升了用户学习效率。
-
公开(公告)号:CN108701127A
公开(公告)日:2018-10-23
申请号:CN201780013260.4
申请日:2017-02-21
Applicant: 三星电子株式会社
CPC classification number: G10L13/08 , G06F3/167 , G06F16/90332 , G06F17/271 , G06F17/2765 , G06F17/2785
Abstract: 提供了一种电子设备。所述电子设备包含至少一个通信电路、显示器、扬声器、存储器、以及电连接至通信电路、显示器、存储器和扬声器的处理器。处理器被配置为:通过所述至少一个通信电路接收包含链接或内容的一个或多个项目的消息,解析所述消息以便识别所述一个或多个项目,从所述一个或多个项目或者从与所述一个或多个项目相关的外部资源提取或接收内容,根据所解析的消息和提取或接收到的内容中的至少一个将所述消息转换为语音、声音、图像、视频和数据中的至少一个,并将语音、声音、图像、视频和数据中的至少一个提供给扬声器或所述至少一个通信电路。
-
公开(公告)号:CN108665888A
公开(公告)日:2018-10-16
申请号:CN201810448710.9
申请日:2018-05-11
Applicant: 西安石油大学
IPC: G10L13/10 , G10L13/08 , G10L13/047 , G06F17/30
CPC classification number: G10L13/10 , G10L13/047 , G10L13/08 , G10L2013/105
Abstract: 本发明涉及一种将书面符号、图像转换成音频数据的系统及方法。该系统包括上位机、分别与上位机连接的用于采集声音的书面符号载体与音乐图像的数据采集模块、用于提供匹配数据信息的数据库和数据处理模块;还包括用于将现有音乐素材倒入数据库的数据录入模块、数据转化模块和数据导出模块;数据处理模块、数据转化模块和数据导出模块依次连接;数据库还分别与数据录入模块、数据处理模块连接;数据处理模块包括文字对比模块和图像比对模块;文字对比模块和图像对比模块分别与数据库连接;数据转化模块用于将比对后的文字和图像转化为音频曲线图。本发明提供了一种可以将人类语音、音乐的书面符号载体与音频、图像信号的相互转换的系统及方法。
-
公开(公告)号:CN108630213A
公开(公告)日:2018-10-09
申请号:CN201710761063.2
申请日:2017-08-30
Inventor: 山本雅裕
IPC: G10L21/013 , G10L21/003
CPC classification number: G10L13/08 , G10L13/033 , G10L13/04 , G10L13/10 , G10L21/003
Abstract: 提供能够使利用者的注意力增强的声音处理装置、声音处理方法以及存储介质。声音处理装置具备确定部、决定部和调制部。确定部确定要输出的声音的强调部分。决定部决定多个输出部中的、要输出用于强调强调部分的声音的第1输出部及第2输出部。调制部对使第1输出部输出的第1声音及使第2输出部输出的第2声音中的至少一方的强调部分进行调制,以使得在第1声音的强调部分与第2声音的强调部分之间,音调及相位中的至少一方不同。
-
公开(公告)号:CN108364639A
公开(公告)日:2018-08-03
申请号:CN201810145526.7
申请日:2014-08-22
Inventor: 陈浪舟
Abstract: 一种训练用于文本转语音系统的声学模型的方法,所述方法包括:接收语音数据,所述语音数据包括对应于第一语音因素的不同值的数据,并且其中所述语音数据未标记,从而对于给定的语音数据项,所述第一语音因素的值未知;根据所述第一语音因素的值将所述语音数据聚簇为第一聚类集;以及估计第一参数集以使得所述声学模型能够针对所述第一语音因素的不同值适应语音;其中所述聚簇和所述第一参数估计根据共同的最大似然性准则联合执行。
-
公开(公告)号:CN108242195A
公开(公告)日:2018-07-03
申请号:CN201711400956.0
申请日:2017-12-22
Applicant: 昆山遥矽微电子科技有限公司
Inventor: 高沁瑶
CPC classification number: G09B21/006 , G10L13/08
Abstract: 本发明公开了一种能够自动识别文字的盲人阅读机,其特征在于,包括:摄像头,连接于摄像头的主机,固定于主机下并可拆卸固定上述摄像头的固定壳,连接于主机的X向移动件,连接于X向移动件的Z向移动件,固定Z向移动件的支撑架。本发明能够将图片信息转变为语音信息,方便盲人阅读普通读物,且自动带动摄像头移动,无需手动更换位置,完成一整页的阅读,使用方便,节省人力。
-
公开(公告)号:CN107833572A
公开(公告)日:2018-03-23
申请号:CN201711080690.6
申请日:2017-11-06
Applicant: 芋头科技(杭州)有限公司
Inventor: 孟猛
IPC: G10L13/08 , G10L13/033 , G10L13/04 , G10L15/26 , G10L15/02
CPC classification number: G10L13/08 , G10L13/033 , G10L13/043 , G10L15/02 , G10L15/26
Abstract: 本发明公开了一种模拟用户说话的语音合成方法及系统,属于语音合成技术领域;方法包括步骤S1,获取外部输入的一段待模拟语音;步骤S2,将待模拟语音识别为对应的包括多个顺序排列的基本音子的发音文本;步骤S3,根据待模拟语音分别处理得到发音文本中每个基本音子的发音时段信息;步骤S4,将发音文本和发音时段信息送入包括一预先训练形成的语音合成模型的语音合成器中,以得到对应于待模拟语音的合成语音并输出。系统包括语音获取单元、语音识别单元、处理单元以及合成单元。上述技术方案的有益效果是:体现语音模拟应用的音色一致性,突出应用本身的个性特点,同时提供给用户更有特色的合成语音,提升用户的使用体验。
-
-
-
-
-
-
-
-
-