-
公开(公告)号:CN107146623A
公开(公告)日:2017-09-08
申请号:CN201710223526.X
申请日:2017-04-07
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明提出一种基于人工智能的语音识别方法、装置和系统,其中,方法包括:在语音识别过程中,采集待识别的语音数据;通过与服务端的上行连接,向服务端发送上行数据流,其中,上行数据流包括语音数据;在向服务端发送上行数据流的过程中,并行通过与服务端的下行连接,接收服务端发送的下行数据流;其中,下行数据流,包括结果数据,结果数据是服务端根据语音数据进行语音识别得到的。该方法通过两条并行的数据流,以流式数据传输的方式实现了待识别语音数据的实时上传和语音识别结果的实时下发,解决了现有技术中无法实现数据的实时上传和实时下发的技术问题。
-
公开(公告)号:CN107146623B
公开(公告)日:2021-03-16
申请号:CN201710223526.X
申请日:2017-04-07
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明提出一种基于人工智能的语音识别方法、装置和系统,其中,方法包括:在语音识别过程中,采集待识别的语音数据;通过与服务端的上行连接,向服务端发送上行数据流,其中,上行数据流包括语音数据;在向服务端发送上行数据流的过程中,并行通过与服务端的下行连接,接收服务端发送的下行数据流;其中,下行数据流,包括结果数据,结果数据是服务端根据语音数据进行语音识别得到的。该方法通过两条并行的数据流,以流式数据传输的方式实现了待识别语音数据的实时上传和语音识别结果的实时下发,解决了现有技术中无法实现数据的实时上传和实时下发的技术问题。
-
公开(公告)号:CN107644095A
公开(公告)日:2018-01-30
申请号:CN201710899016.4
申请日:2017-09-28
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请实施例公开了用于搜索信息的方法和装置。该方法的一具体实施方式包括:响应于确定终端停止发送语音搜索信息,将从所述终端接收到的最终语音搜索信息进行语音识别,得到最终语音识别结果;根据所述最终语音识别结果从缓存中预先存储的待展示信息中选取最终待展示信息,其中,所述缓存中存储有至少一条基于中间语音识别结果获取的待展示信息,其中,所述中间语音识别结果是对所述终端发送的语音搜索信息进行实时语音识别得到的;将所述最终待展示信息发送到所述终端,以供所述终端进行展示。该实施方式通过从缓存中直接选取最终待展示信息,从而节省了根据最终语音识别结果获取待展示信息的时间,提高了语音搜索的速度。
-
公开(公告)号:CN107622766A
公开(公告)日:2018-01-23
申请号:CN201710900370.4
申请日:2017-09-28
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请实施例公开了用于搜索信息的方法和装置。该方法的一具体实施方式包括:响应于确定终端停止发送语音搜索信息,将从所述终端接收到的最终语音搜索信息进行语音识别,得到最终语音识别结果;将所述最终语音识别结果与基于中间语音识别结果得到的至少一条中间搜索用信息进行匹配;响应于所述最终识别结果与所述至少一条中间搜索用信息中的中间搜索用信息匹配成功,将匹配成功的中间搜索用信息对应的搜索结果信息的指示符作为目标指示符发送到所述终端,以供所述终端根据所述目标指示符获取搜索结果信息进行展示。该实施方式节省了根据最终语音识别结果获取搜索结果信息的时间,提高了语音搜索的速度。
-
公开(公告)号:CN107943834B
公开(公告)日:2021-06-11
申请号:CN201711008491.4
申请日:2017-10-25
Applicant: 百度在线网络技术(北京)有限公司 , 上海小度技术有限公司
IPC: G06F16/332 , G10L15/18 , G10L15/22 , H04L29/06
Abstract: 本发明公开了人机对话的实现方法、装置、设备及存储介质,其中方法包括:客户端获取用户的语音数据,将语音数据发送给语音识别服务器,以便语音识别服务器对语音数据进行语音识别,并将语音识别结果发送给语义理解服务器进行语义理解;客户端获取语音合成服务器根据获取到的回复内容生成的语音信息,并将语音信息播报给用户,回复内容为语义理解服务器根据语义理解结果生成的。应用本发明所述方案,能够提升语音交互的响应速度。
-
公开(公告)号:CN107622766B
公开(公告)日:2021-01-05
申请号:CN201710900370.4
申请日:2017-09-28
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请实施例公开了用于搜索信息的方法和装置。该方法的一具体实施方式包括:响应于确定终端停止发送语音搜索信息,将从所述终端接收到的最终语音搜索信息进行语音识别,得到最终语音识别结果;将所述最终语音识别结果与基于中间语音识别结果得到的至少一条中间搜索用信息进行匹配;响应于所述最终识别结果与所述至少一条中间搜索用信息中的中间搜索用信息匹配成功,将匹配成功的中间搜索用信息对应的搜索结果信息的指示符作为目标指示符发送到所述终端,以供所述终端根据所述目标指示符获取搜索结果信息进行展示。该实施方式节省了根据最终语音识别结果获取搜索结果信息的时间,提高了语音搜索的速度。
-
公开(公告)号:CN105489216A
公开(公告)日:2016-04-13
申请号:CN201610034930.8
申请日:2016-01-19
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L13/02 , H04L12/721
Abstract: 本发明公开了一种语音合成系统的优化方法和装置,其中,语音合成系统的优化方法包括:接收包含文本信息的语音合成请求;确定在接收到语音合成请求时语音合成系统的负载等级;以及选择与负载等级对应的语音合成路径,并根据语音合成路径对文本信息进行语音合成。本发明实施例的语音合成系统的优化方法和装置,通过接收包含文本信息的语音合成请求,并确定在接收到语音合成请求时语音合成系统的负载等级,以及选择与负载等级对应的语音合成路径,并根据语音合成路径对文本信息进行语音合成,能够根据语音合成系统的负载等级弹性地选择相应的语音合成路径,从而实现语音合成,为用户提供更加稳定的服务,避免延时情况的发生,提升用户使用体验。
-
公开(公告)号:CN105355194A
公开(公告)日:2016-02-24
申请号:CN201510690575.5
申请日:2015-10-22
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L13/047
CPC classification number: G10L13/047
Abstract: 本发明提出一种语音合成方法和装置,该语音合成方法包括:向服务器发送数据文件查询请求;接收所述服务器发送的适合所述终端设备的计算能力的声学模型列表,所述声学模型列表中包括至少一个音色对应的声学模型;将所述声学模型列表显示给使用所述终端设备的用户,以供所述用户从所述声学模型列表中选择音色对应的声学模型;下载并保存所述用户选择的音色对应的声学模型;通过保存的声学模型进行语音合成。本发明可以使得语音合成在不同计算能力的终端设备上,都有很好地表现,在计算能力较差的设备上,可以流畅地进行语音合成,不影响用户接收语音中所包含的信息;在计算能力较好的设备上,可以合成出更加自然的语音,改善用户的人机交互体验。
-
公开(公告)号:CN104992703A
公开(公告)日:2015-10-21
申请号:CN201510441079.6
申请日:2015-07-24
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L13/02
CPC classification number: G10L13/02
Abstract: 本发明提出一种语音合成方法和系统,该语音合成方法包括:在需要语音合成时,从服务端查询可用音库列表,所述可用音库列表中包括多个可用音库的信息,所述可用音库包括特色音库;获取用户根据所述可用音库列表选择的音库,并从服务端下载用户选择的音库;采用下载的音库,将文本合成为语音。该方法能够降低离线语音合成APP的体积,并且可以为用户提供更多选择,实现个性化语音合成。
-
公开(公告)号:CN105489216B
公开(公告)日:2020-03-03
申请号:CN201610034930.8
申请日:2016-01-19
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L13/02 , H04L12/721
Abstract: 本发明公开了一种语音合成系统的优化方法和装置,其中,语音合成系统的优化方法包括:接收包含文本信息的语音合成请求;确定在接收到语音合成请求时语音合成系统的负载等级;以及选择与负载等级对应的语音合成路径,并根据语音合成路径对文本信息进行语音合成。本发明实施例的语音合成系统的优化方法和装置,通过接收包含文本信息的语音合成请求,并确定在接收到语音合成请求时语音合成系统的负载等级,以及选择与负载等级对应的语音合成路径,并根据语音合成路径对文本信息进行语音合成,能够根据语音合成系统的负载等级弹性地选择相应的语音合成路径,从而实现语音合成,为用户提供更加稳定的服务,避免延时情况的发生,提升用户使用体验。
-
-
-
-
-
-
-
-
-