-
公开(公告)号:CN109559734B
公开(公告)日:2022-02-18
申请号:CN201811552516.1
申请日:2018-12-18
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L13/08 , G10L13/10 , G10L13/047 , G10L25/03
Abstract: 本发明实施例提出一种声学模型训练的加速方法和装置。该方法包括:将声学模型训练过程按照步骤划分为多个任务;获取计算节点集群中各节点的资源占用情况;根据各节点的资源占用情况和任务复杂度,向各节点分发对应的任务。本发明实施例可以利用分布在多个节点的计算资源对声学模型训练任务进行分布式并行计算,提高训练效率,适用于大规模声学模型训练的复杂情况。
-
公开(公告)号:CN109559734A
公开(公告)日:2019-04-02
申请号:CN201811552516.1
申请日:2018-12-18
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L13/08 , G10L13/10 , G10L13/047 , G10L25/03
Abstract: 本发明实施例提出一种声学模型训练的加速方法和装置。该方法包括:将声学模型训练过程按照步骤划分为多个任务;获取计算节点集群中各节点的资源占用情况;根据各节点的资源占用情况和任务复杂度,向各节点分发对应的任务。本发明实施例可以利用分布在多个节点的计算资源对声学模型训练任务进行分布式并行计算,提高训练效率,适用于大规模声学模型训练的复杂情况。
-
公开(公告)号:CN108462892A
公开(公告)日:2018-08-28
申请号:CN201810251988.7
申请日:2018-03-26
Applicant: 百度在线网络技术(北京)有限公司
IPC: H04N21/426 , H04N21/43 , H04N21/437
Abstract: 本申请提供一种图像和音频同步播放的处理方法及设备,该方法包括:获取播报终端发送的播放服务请求;获取播放服务请求对应的播放画面数据和音频数据,播放画面数据根据播放内容分为多个分组;将播放画面数据、音频数据、用于确定每个分组与音频数据的属性信息的第一对应关系的信息发送给播报终端,以使播报终端根据第一对应关系对播放画面数据和音频数据进行相应的同步播放处理。由于建立了音频数据与各分组的播放内容的对应关系,使得播报终端在播放时能够准确地进行播报的音频内容与显示的播放画面的同步,有效提高了音频播报与屏幕显示同步的准确性,从而使用户更好地定位显示界面中与当前语音播报内容对应的显示信息。
-
公开(公告)号:CN105489216A
公开(公告)日:2016-04-13
申请号:CN201610034930.8
申请日:2016-01-19
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L13/02 , H04L12/721
Abstract: 本发明公开了一种语音合成系统的优化方法和装置,其中,语音合成系统的优化方法包括:接收包含文本信息的语音合成请求;确定在接收到语音合成请求时语音合成系统的负载等级;以及选择与负载等级对应的语音合成路径,并根据语音合成路径对文本信息进行语音合成。本发明实施例的语音合成系统的优化方法和装置,通过接收包含文本信息的语音合成请求,并确定在接收到语音合成请求时语音合成系统的负载等级,以及选择与负载等级对应的语音合成路径,并根据语音合成路径对文本信息进行语音合成,能够根据语音合成系统的负载等级弹性地选择相应的语音合成路径,从而实现语音合成,为用户提供更加稳定的服务,避免延时情况的发生,提升用户使用体验。
-
公开(公告)号:CN110797004B
公开(公告)日:2021-01-26
申请号:CN201810864442.9
申请日:2018-08-01
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请实施例公开了数据传输方法和装置。该方法的一具体实施方式包括:基于音频数据中的边界信息,对音频数据进行切分,得到多个包数据;对多个包数据中的每一个包数据进行编码,得到编码后的包数据,以及按照对应的播放次序,将编码后的包数据发送至终端。实现了以流式方式即将音频数据切分为包数据传输音频数据至终端并且可自适应网络状况控制切分方式,避免了诸如根据文本的停顿进行断句后传输较长的语句的语音而造成的播放卡顿的问题。同时,基于边界信息对音频数据的精确切分可确保每一个包数据在字的粒度上的完整性,避免了音频数据的播放中的抖动问题。
-
公开(公告)号:CN105489216B
公开(公告)日:2020-03-03
申请号:CN201610034930.8
申请日:2016-01-19
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L13/02 , H04L12/721
Abstract: 本发明公开了一种语音合成系统的优化方法和装置,其中,语音合成系统的优化方法包括:接收包含文本信息的语音合成请求;确定在接收到语音合成请求时语音合成系统的负载等级;以及选择与负载等级对应的语音合成路径,并根据语音合成路径对文本信息进行语音合成。本发明实施例的语音合成系统的优化方法和装置,通过接收包含文本信息的语音合成请求,并确定在接收到语音合成请求时语音合成系统的负载等级,以及选择与负载等级对应的语音合成路径,并根据语音合成路径对文本信息进行语音合成,能够根据语音合成系统的负载等级弹性地选择相应的语音合成路径,从而实现语音合成,为用户提供更加稳定的服务,避免延时情况的发生,提升用户使用体验。
-
公开(公告)号:CN110797004A
公开(公告)日:2020-02-14
申请号:CN201810864442.9
申请日:2018-08-01
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请实施例公开了数据传输方法和装置。该方法的一具体实施方式包括:基于音频数据中的边界信息,对音频数据进行切分,得到多个包数据;对多个包数据中的每一个包数据进行编码,得到编码后的包数据,以及按照对应的播放次序,将编码后的包数据发送至终端。实现了以流式方式即将音频数据切分为包数据传输音频数据至终端并且可自适应网络状况控制切分方式,避免了诸如根据文本的停顿进行断句后传输较长的语句的语音而造成的播放卡顿的问题。同时,基于边界信息对音频数据的精确切分可确保每一个包数据在字的粒度上的完整性,避免了音频数据的播放中的抖动问题。
-
公开(公告)号:CN108462892B
公开(公告)日:2019-08-06
申请号:CN201810251988.7
申请日:2018-03-26
Applicant: 百度在线网络技术(北京)有限公司
IPC: H04N21/426 , H04N21/43 , H04N21/437
Abstract: 本申请提供一种图像和音频同步播放的处理方法及设备,该方法包括:获取播报终端发送的播放服务请求;获取播放服务请求对应的播放画面数据和音频数据,播放画面数据根据播放内容分为多个分组;将播放画面数据、音频数据、用于确定每个分组与音频数据的属性信息的第一对应关系的信息发送给播报终端,以使播报终端根据第一对应关系对播放画面数据和音频数据进行相应的同步播放处理。由于建立了音频数据与各分组的播放内容的对应关系,使得播报终端在播放时能够准确地进行播报的音频内容与显示的播放画面的同步,有效提高了音频播报与屏幕显示同步的准确性,从而使用户更好地定位显示界面中与当前语音播报内容对应的显示信息。
-
-
-
-
-
-
-