-
公开(公告)号:CN104992703B
公开(公告)日:2017-10-03
申请号:CN201510441079.6
申请日:2015-07-24
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L13/02
CPC classification number: G10L13/02
Abstract: 本发明提出一种语音合成方法和系统,该语音合成方法包括:在需要语音合成时,从服务端查询可用音库列表,所述可用音库列表中包括多个可用音库的信息,所述可用音库包括特色音库;获取用户根据所述可用音库列表选择的音库,并从服务端下载用户选择的音库;采用下载的音库,将文本合成为语音。该方法能够降低离线语音合成APP的体积,并且可以为用户提供更多选择,实现个性化语音合成。
-
公开(公告)号:CN107808670B
公开(公告)日:2021-05-14
申请号:CN201711010711.7
申请日:2017-10-25
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L15/22 , G10L15/26 , G10L15/30 , G06F9/4401
Abstract: 本发明公开了语音数据处理方法、装置、设备及存储介质,其中方法包括:客户端获取语音数据,利用语音唤醒引擎对获取到的语音数据进行唤醒识别,并将获取到的语音数据保存到循环缓存队列中;客户端获取语音唤醒引擎在完成唤醒识别后返回的唤醒识别结果,若唤醒识别结果为确认唤醒,且确定当前处于oneshot情况,则确定出截取起始位置,并获取循环缓存队列中从截取起始位置开始到队列尾端的缓存数据,缓存数据中至少包括识别内容;客户端将缓存数据发送给语音识别引擎,以便语音识别引擎对缓存数据中的识别内容进行语音识别。应用本发明所述方案,能够提高语音识别结果的准确性等。
-
公开(公告)号:CN107808670A
公开(公告)日:2018-03-16
申请号:CN201711010711.7
申请日:2017-10-25
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L15/22 , G10L15/26 , G10L15/30 , G06F9/4401
CPC classification number: G10L15/26 , G06F9/4418 , G10L15/22 , G10L15/30
Abstract: 本发明公开了语音数据处理方法、装置、设备及存储介质,其中方法包括:客户端获取语音数据,利用语音唤醒引擎对获取到的语音数据进行唤醒识别,并将获取到的语音数据保存到循环缓存队列中;客户端获取语音唤醒引擎在完成唤醒识别后返回的唤醒识别结果,若唤醒识别结果为确认唤醒,且确定当前处于oneshot情况,则确定出截取起始位置,并获取循环缓存队列中从截取起始位置开始到队列尾端的缓存数据,缓存数据中至少包括识别内容;客户端将缓存数据发送给语音识别引擎,以便语音识别引擎对缓存数据中的识别内容进行语音识别。应用本发明所述方案,能够提高语音识别结果的准确性等。
-
公开(公告)号:CN105355194A
公开(公告)日:2016-02-24
申请号:CN201510690575.5
申请日:2015-10-22
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L13/047
CPC classification number: G10L13/047
Abstract: 本发明提出一种语音合成方法和装置,该语音合成方法包括:向服务器发送数据文件查询请求;接收所述服务器发送的适合所述终端设备的计算能力的声学模型列表,所述声学模型列表中包括至少一个音色对应的声学模型;将所述声学模型列表显示给使用所述终端设备的用户,以供所述用户从所述声学模型列表中选择音色对应的声学模型;下载并保存所述用户选择的音色对应的声学模型;通过保存的声学模型进行语音合成。本发明可以使得语音合成在不同计算能力的终端设备上,都有很好地表现,在计算能力较差的设备上,可以流畅地进行语音合成,不影响用户接收语音中所包含的信息;在计算能力较好的设备上,可以合成出更加自然的语音,改善用户的人机交互体验。
-
公开(公告)号:CN104992703A
公开(公告)日:2015-10-21
申请号:CN201510441079.6
申请日:2015-07-24
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L13/02
CPC classification number: G10L13/02
Abstract: 本发明提出一种语音合成方法和系统,该语音合成方法包括:在需要语音合成时,从服务端查询可用音库列表,所述可用音库列表中包括多个可用音库的信息,所述可用音库包括特色音库;获取用户根据所述可用音库列表选择的音库,并从服务端下载用户选择的音库;采用下载的音库,将文本合成为语音。该方法能够降低离线语音合成APP的体积,并且可以为用户提供更多选择,实现个性化语音合成。
-
-
-
-