高保真的智能客服语音合成方法

    公开(公告)号:CN109686358A

    公开(公告)日:2019-04-26

    申请号:CN201811584612.4

    申请日:2018-12-24

    CPC classification number: G10L13/02 G10L13/08 G10L13/10

    Abstract: 本发明公开了一种高保真的智能客服语音合成方法,包括:进行语音的录制;建立初始语料库;对录制好的语音进行强制对齐;进行语音切割得到三音子模型;利用三音子模型形成目标语料库;对于切割好的三音子基元计算似然;建立三音子决策树;根据所需合成文本选择合适的三音子基元;对选择的三音子基元,针对原始语音波形做基音同步标注;对原始语音波形的基音曲线与目标基音曲线建立映射,得到短时合成信号序列;将短时信号序列与目标基音周期同步排列,重叠相加得到拼接合成的语音;将合成的语音插入到提前录制好的语音中。本发明不必让客服人员录制大量重复类似的含有变量的语音,能够降低语音录制成本,还能提升整个对话过程的流畅性与自然度。

    聊天信息的语音播报方法、装置、计算机设备及存储介质

    公开(公告)号:CN109660446A

    公开(公告)日:2019-04-19

    申请号:CN201811286723.7

    申请日:2018-10-31

    Inventor: 李岩

    CPC classification number: H04L51/046 G10L13/08 H04L51/066 H04M1/72558

    Abstract: 本发明提供了一种聊天信息的语音播报方法、装置、计算机设备以及存储介质,涉及通信技术领域,其中方法包括:当检测到开启语音播报功能时,获得与在即时通信软件的聊天界面中显示的聊天消息相对应的聊天消息信息、聊天消息ID并添加在播报消息队列中;从播报队列中获取聊天消息信息进行语音播报处理;当检测到启动返回聊天功能或停止语音播报功能时,获得与当前进行语音播报处理的聊天消息信息相对应的聊天消息ID,将此聊天消息ID传回即时通信软件。本发明的方法、装置、计算机设备以及存储介质,使用户做其它事情期间,也可以获得即时通信工具的聊天信息,避免了用户在做其它事情的期间中因查看聊天消息而带来的安全隐患,提高使用感受度。

    一种语音播报方法、装置及系统

    公开(公告)号:CN109036372A

    公开(公告)日:2018-12-18

    申请号:CN201810971540.2

    申请日:2018-08-24

    CPC classification number: G10L13/02 G10L13/08

    Abstract: 本申请公开了一种语音播报方法、装置及系统,由服务端确定待播报文本中所包含的角色,及每一角色对应的文本内容,进一步为每一角色确定了对应的发声终端,通过向发声终端发送播报指令,可以使得发声终端以语音形式播报对应角色的文本内容,本申请通过将待播报文本按照角色划分对应的文本内容,并使用角色对应的发声终端对角色的文本内容进行播报,类似于话剧表演过程,更加便于用户对待播报文本内容的理解,且趣味性更强,提升了用户学习效率。

    电子设备及其操作方法
    5.
    发明公开

    公开(公告)号:CN108701127A

    公开(公告)日:2018-10-23

    申请号:CN201780013260.4

    申请日:2017-02-21

    Abstract: 提供了一种电子设备。所述电子设备包含至少一个通信电路、显示器、扬声器、存储器、以及电连接至通信电路、显示器、存储器和扬声器的处理器。处理器被配置为:通过所述至少一个通信电路接收包含链接或内容的一个或多个项目的消息,解析所述消息以便识别所述一个或多个项目,从所述一个或多个项目或者从与所述一个或多个项目相关的外部资源提取或接收内容,根据所解析的消息和提取或接收到的内容中的至少一个将所述消息转换为语音、声音、图像、视频和数据中的至少一个,并将语音、声音、图像、视频和数据中的至少一个提供给扬声器或所述至少一个通信电路。

    一种将书面符号、图像转换成音频数据的系统及方法

    公开(公告)号:CN108665888A

    公开(公告)日:2018-10-16

    申请号:CN201810448710.9

    申请日:2018-05-11

    Inventor: 唐继凯 唐子雯

    CPC classification number: G10L13/10 G10L13/047 G10L13/08 G10L2013/105

    Abstract: 本发明涉及一种将书面符号、图像转换成音频数据的系统及方法。该系统包括上位机、分别与上位机连接的用于采集声音的书面符号载体与音乐图像的数据采集模块、用于提供匹配数据信息的数据库和数据处理模块;还包括用于将现有音乐素材倒入数据库的数据录入模块、数据转化模块和数据导出模块;数据处理模块、数据转化模块和数据导出模块依次连接;数据库还分别与数据录入模块、数据处理模块连接;数据处理模块包括文字对比模块和图像比对模块;文字对比模块和图像对比模块分别与数据库连接;数据转化模块用于将比对后的文字和图像转化为音频曲线图。本发明提供了一种可以将人类语音、音乐的书面符号载体与音频、图像信号的相互转换的系统及方法。

    声音处理装置、声音处理方法以及存储介质

    公开(公告)号:CN108630213A

    公开(公告)日:2018-10-09

    申请号:CN201710761063.2

    申请日:2017-08-30

    Inventor: 山本雅裕

    CPC classification number: G10L13/08 G10L13/033 G10L13/04 G10L13/10 G10L21/003

    Abstract: 提供能够使利用者的注意力增强的声音处理装置、声音处理方法以及存储介质。声音处理装置具备确定部、决定部和调制部。确定部确定要输出的声音的强调部分。决定部决定多个输出部中的、要输出用于强调强调部分的声音的第1输出部及第2输出部。调制部对使第1输出部输出的第1声音及使第2输出部输出的第2声音中的至少一方的强调部分进行调制,以使得在第1声音的强调部分与第2声音的强调部分之间,音调及相位中的至少一方不同。

    语音处理系统和方法
    8.
    发明公开

    公开(公告)号:CN108364639A

    公开(公告)日:2018-08-03

    申请号:CN201810145526.7

    申请日:2014-08-22

    Inventor: 陈浪舟

    CPC classification number: G10L13/08 G10L13/02 G10L13/10 G10L15/06

    Abstract: 一种训练用于文本转语音系统的声学模型的方法,所述方法包括:接收语音数据,所述语音数据包括对应于第一语音因素的不同值的数据,并且其中所述语音数据未标记,从而对于给定的语音数据项,所述第一语音因素的值未知;根据所述第一语音因素的值将所述语音数据聚簇为第一聚类集;以及估计第一参数集以使得所述声学模型能够针对所述第一语音因素的不同值适应语音;其中所述聚簇和所述第一参数估计根据共同的最大似然性准则联合执行。

    能够自动识别文字的盲人阅读机

    公开(公告)号:CN108242195A

    公开(公告)日:2018-07-03

    申请号:CN201711400956.0

    申请日:2017-12-22

    Inventor: 高沁瑶

    CPC classification number: G09B21/006 G10L13/08

    Abstract: 本发明公开了一种能够自动识别文字的盲人阅读机,其特征在于,包括:摄像头,连接于摄像头的主机,固定于主机下并可拆卸固定上述摄像头的固定壳,连接于主机的X向移动件,连接于X向移动件的Z向移动件,固定Z向移动件的支撑架。本发明能够将图片信息转变为语音信息,方便盲人阅读普通读物,且自动带动摄像头移动,无需手动更换位置,完成一整页的阅读,使用方便,节省人力。

    一种模拟用户说话的语音合成方法及系统

    公开(公告)号:CN107833572A

    公开(公告)日:2018-03-23

    申请号:CN201711080690.6

    申请日:2017-11-06

    Inventor: 孟猛

    CPC classification number: G10L13/08 G10L13/033 G10L13/043 G10L15/02 G10L15/26

    Abstract: 本发明公开了一种模拟用户说话的语音合成方法及系统,属于语音合成技术领域;方法包括步骤S1,获取外部输入的一段待模拟语音;步骤S2,将待模拟语音识别为对应的包括多个顺序排列的基本音子的发音文本;步骤S3,根据待模拟语音分别处理得到发音文本中每个基本音子的发音时段信息;步骤S4,将发音文本和发音时段信息送入包括一预先训练形成的语音合成模型的语音合成器中,以得到对应于待模拟语音的合成语音并输出。系统包括语音获取单元、语音识别单元、处理单元以及合成单元。上述技术方案的有益效果是:体现语音模拟应用的音色一致性,突出应用本身的个性特点,同时提供给用户更有特色的合成语音,提升用户的使用体验。

Patent Agency Ranking