-
公开(公告)号:CN110069608B
公开(公告)日:2022-05-27
申请号:CN201810816608.X
申请日:2018-07-24
Applicant: 百度在线网络技术(北京)有限公司 , 上海小度技术有限公司
Inventor: 常先堂
Abstract: 本发明提供了一种语音交互的方法、装置、设备和计算机存储介质,所述方法包括:接收第一终端设备发送的语音数据;获取所述语音数据的语音识别结果以及声纹识别结果;获取针对所述语音识别结果的响应文本,利用所述声纹识别结果对所述响应文本进行语音转换;将转换得到的音频数据发送至所述第一终端设备。本发明实现了人机交互的语音自适应,增强了人机语音交互的真实感,提升了人机语音交互的趣味性。
-
公开(公告)号:CN107943834B
公开(公告)日:2021-06-11
申请号:CN201711008491.4
申请日:2017-10-25
Applicant: 百度在线网络技术(北京)有限公司 , 上海小度技术有限公司
IPC: G06F16/332 , G10L15/18 , G10L15/22 , H04L29/06
Abstract: 本发明公开了人机对话的实现方法、装置、设备及存储介质,其中方法包括:客户端获取用户的语音数据,将语音数据发送给语音识别服务器,以便语音识别服务器对语音数据进行语音识别,并将语音识别结果发送给语义理解服务器进行语义理解;客户端获取语音合成服务器根据获取到的回复内容生成的语音信息,并将语音信息播报给用户,回复内容为语义理解服务器根据语义理解结果生成的。应用本发明所述方案,能够提升语音交互的响应速度。
-
公开(公告)号:CN108899023B
公开(公告)日:2019-12-31
申请号:CN201810688923.9
申请日:2018-06-28
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 常先堂
Abstract: 本申请实施例公开了控制方法和装置。该方法的一具体实施方式包括:从目标终端接收用户语音音频和目标终端的标识;基于标识,确定与目标终端预先建立关联关系的终端作为目标终端的关联终端;响应于确定用户语音音频指示关联终端执行操作,向关联终端发送控制指令,其中,控制指令用于指示关联终端执行用户语音音频所指示的操作。该实施方式提高了控制方式的丰富性,提高了控制的灵活性。
-
公开(公告)号:CN108492827B
公开(公告)日:2019-07-30
申请号:CN201810282805.8
申请日:2018-04-02
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 常先堂
IPC: G10L15/22
Abstract: 本发明提供一种应用程序的唤醒处理方法、装置及存储介质,通过采集并识别用户输入的第一语音数据,并在每次识别出第一语音数据中包括目标应用程序的唤醒词时对目标应用程序执行唤醒操作,其中,第一语音数据中一次或多次出现目标应用程序的唤醒词。本发明提供的应用程序的唤醒处理方法、装置及存储介质,能够在用户输入的第一语音数据中包括一次或多次出现的唤醒词时,对目标应用程序进行唤醒,从而提高了应用程序唤醒的准确度。
-
公开(公告)号:CN109637519A
公开(公告)日:2019-04-16
申请号:CN201811344027.7
申请日:2018-11-13
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明公开了语音交互实现方法、装置、计算机设备及存储介质,其中方法包括:内容服务器获取来自设备端的用户的语音信息,并按照第一方式完成本次语音交互;所述第一方式包括:将语音信息发送给自动语音识别服务器,获取自动语音识别服务器每次返回的部分语音识别结果;当确定出语音活动检测开始之后,针对每次获取到的部分语音识别结果,若通过语义理解确定出该部分语音识别结果中已经包含了用户希望表达的完整内容,则将该部分语音识别结果作为最终的语音识别结果,获取最终的语音识别结果对应的应答语音,返回给设备端。应用本发明所述方案,能够提升语音交互响应速度等。
-
公开(公告)号:CN107220033A
公开(公告)日:2017-09-29
申请号:CN201710542258.8
申请日:2017-07-05
Applicant: 百度在线网络技术(北京)有限公司
CPC classification number: G06F9/3851 , G06F9/3009
Abstract: 本申请公开了用于控制线程池中线程数量的方法和装置。该方法的一具体实施方式包括:获取线程池的任务队列中待处理任务的数量;响应于待处理任务的数量大于第一预定数量且线程池所在系统的CPU使用率小于预定阈值,根据预定规则增大线程池的最大并发线程数;根据增大后的最大并发线程数创建线程。该实施方式提高了线程池的运行效率。
-
公开(公告)号:CN108932946B
公开(公告)日:2020-03-13
申请号:CN201810717154.0
申请日:2018-06-29
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 常先堂
Abstract: 本发明实施例提出一种客需服务的语音交互方法和装置,方法包括接收来自客户需求端的客户需求信息,客户需求信息中包括客户需求端标识和语音需求指令;对语音需求指令进行语音识别;若识别到语音需求指令中的所需服务类型,则根据所需服务类型向服务管理系统发送提供服务请求,提供服务请求中包括客户需求端标识和所需服务类型。本发明实施例由于采用语音交互的方式,实现了客户需求端、服务管理系统及客户之间的交互,因此能够快速智能的识别出客户的需求并提供相应的服务。
-
公开(公告)号:CN108932946A
公开(公告)日:2018-12-04
申请号:CN201810717154.0
申请日:2018-06-29
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 常先堂
Abstract: 本发明实施例提出一种客需服务的语音交互方法和装置,方法包括接收来自客户需求端的客户需求信息,客户需求信息中包括客户需求端标识和语音需求指令;对语音需求指令进行语音识别;若识别到语音需求指令中的所需服务类型,则根据所需服务类型向服务管理系统发送提供服务请求,提供服务请求中包括客户需求端标识和所需服务类型。本发明实施例由于采用语音交互的方式,实现了客户需求端、服务管理系统及客户之间的交互,因此能够快速智能的识别出客户的需求并提供相应的服务。
-
公开(公告)号:CN107993650A
公开(公告)日:2018-05-04
申请号:CN201711238264.0
申请日:2017-11-30
Applicant: 百度在线网络技术(北京)有限公司
CPC classification number: G10L15/063 , G10L15/08 , G10L15/26 , G10L25/60
Abstract: 本申请实施例公开了用于生成信息的方法和装置。该方法的一具体实施方式包括:接收客户端发送的、用户在客户端输入的语音信息;对语音信息进行语音活性检测,生成检测结果信息;将检测结果信息输入至预先训练的语音识别模型,生成文本信息,其中,语音识别模型用以表征检测结果信息与文本信息之间的对应关系;基于文本信息进行搜索,生成搜索结果信息;将搜索结果信息输入至预先训练的语音合成模型,生成语音结果信息,其中,语音合成模型用以表征搜索结果信息与语音结果信息之间的对应关系。该实施方式提高了信息生成的灵活性。
-
公开(公告)号:CN107943834A
公开(公告)日:2018-04-20
申请号:CN201711008491.4
申请日:2017-10-25
Applicant: 百度在线网络技术(北京)有限公司
CPC classification number: G10L15/22 , G06F17/30654 , G10L15/1815 , H04L67/42
Abstract: 本发明公开了人机对话的实现方法、装置、设备及存储介质,其中方法包括:客户端获取用户的语音数据,将语音数据发送给语音识别服务器,以便语音识别服务器对语音数据进行语音识别,并将语音识别结果发送给语义理解服务器进行语义理解;客户端获取语音合成服务器根据获取到的回复内容生成的语音信息,并将语音信息播报给用户,回复内容为语义理解服务器根据语义理解结果生成的。应用本发明所述方案,能够提升语音交互的响应速度。
-
-
-
-
-
-
-
-
-