-
公开(公告)号:CN112530419B
公开(公告)日:2024-05-24
申请号:CN201910888231.3
申请日:2019-09-19
Applicant: 百度在线网络技术(北京)有限公司 , 上海小度技术有限公司
IPC: G10L15/22
Abstract: 本申请公开了语音识别控制方法、装置、电子设备和可读存储介质,涉及人工智能和语音识别领域。具体实现方案为:在第一工作状态下,探测具有设定控制意图的目标操作;其中,第一工作状态下,根据唤醒词采集音频片段,以进行语音识别;若探测到目标操作,执行目标操作对应的控制指令,并将第一工作状态切换为第二工作状态;在第二工作状态下,连续采集音频得到音频流,以进行语音识别。该方案中,用户只需触发具有设定控制意图的目标操作,即可实现与电子设备进行连续交互,而无需连续输入唤醒词,可以简化用户操作,改善用户的使用体验。
-
公开(公告)号:CN109657091B
公开(公告)日:2021-06-22
申请号:CN201910002528.5
申请日:2019-01-02
Applicant: 百度在线网络技术(北京)有限公司 , 上海小度技术有限公司
IPC: G06F16/583 , G06F16/51 , G06F16/683 , G06F16/635 , G06F16/638 , G06F16/78 , G06F16/738 , G10L15/22 , G10L15/26
Abstract: 本发明实施例提出一种语音交互设备的状态呈现方法和装置,其中方法包括:获取语音交互设备的当前状态;根据所述当前状态查找预先存储的状态与呈现方式的对应关系,得到所述当前状态对应的当前呈现方式;采用所述当前呈现方式进行呈现。本发明实施例能够为用户呈现语音交互设备所处的状态,从而为用户提供必要的推荐及提示,提高用户体验。
-
公开(公告)号:CN112669831A
公开(公告)日:2021-04-16
申请号:CN201910933124.8
申请日:2019-09-29
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请公开了语音识别控制方法、装置、电子设备和可读存储介质,涉及人工智能和语音识别领域。具体实现方案为:探测到调用目标场景相关的应用程序接口,则查询第一工作状态的配置信息,以确定目标场景是否适用第一工作状态;若目标场景适用第一工作状态,将执行的第二工作状态切换为第一工作状态;其中,在第二工作状态下,根据唤醒词采集音频片段,对音频片段语音识别;在第一工作状态下,连续采集音频得到音频流,以对音频流语音识别。该方案中,用户可以根据自身需求,设置触发第一工作状态的场景,以满足不同用户的个性化需求,且只有在目标场景适用第一工作状态时,才控制设备进入第一工作状态,可以降低对用户的打扰,改善用户的使用体验。
-
公开(公告)号:CN112581946A
公开(公告)日:2021-03-30
申请号:CN201910933815.8
申请日:2019-09-29
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L15/22
Abstract: 本申请公开了语音控制方法、装置、电子设备和可读存储介质,涉及语音识别领域。具体实现方案为:根据展示页面可响应的语音指令,确定第一引导词,获取展示页面所属前台程序可响应的语音指令,根据前台程序可响应的语音指令,以及根据后台程序可响应的语音指令,确定第二引导词,在目标工作状态下,提示第一引导词和第二引导词;其中,目标工作状态,用于连续采集音频得到音频流,并获取音频流语音识别得到的信息流,以根据信息流进行语音控制。由此,通过在目标状态下提示第一引导词和第二引导词,用户根据第一引导词和第二引导词与电子设备进行语音交互时,无需重复输入唤醒词,可以简化用户操作,改善用户的使用体验。
-
公开(公告)号:CN112581945A
公开(公告)日:2021-03-30
申请号:CN201910933788.4
申请日:2019-09-29
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请公开了语音控制方法、装置、电子设备和可读存储介质,涉及语音识别领域。具体实现方案为:在目标场景下,执行第一工作状态,以根据唤醒词采集音频片段,获取对音频片段语音识别得到的第一控制意图,执行与第一控制意图匹配的控制指令,并将第一工作状态切换为第二工作状态;在第二工作状态下,连续采集音频得到音频流,以对音频流语音识别;若语音识别得到符合目标场景的第二控制意图,执行与第二控制意图匹配的控制指令。由此,对用户连续输入的音频流进行语音识别,仅在得到符合目标场景的第二控制意图时,执行相应的控制指令,不仅无需连续输入唤醒词,简化用户操作,还避免了场景切换导致用户使用体验差的技术问题。
-
公开(公告)号:CN112530419A
公开(公告)日:2021-03-19
申请号:CN201910888231.3
申请日:2019-09-19
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L15/22
Abstract: 本申请公开了语音识别控制方法、装置、电子设备和可读存储介质,涉及人工智能和语音识别领域。具体实现方案为:在第一工作状态下,探测具有设定控制意图的目标操作;其中,第一工作状态下,根据唤醒词采集音频片段,以进行语音识别;若探测到目标操作,执行目标操作对应的控制指令,并将第一工作状态切换为第二工作状态;在第二工作状态下,连续采集音频得到音频流,以进行语音识别。该方案中,用户只需触发具有设定控制意图的目标操作,即可实现与电子设备进行连续交互,而无需连续输入唤醒词,可以简化用户操作,改善用户的使用体验。
-
公开(公告)号:CN112017651B
公开(公告)日:2024-06-04
申请号:CN201910468935.5
申请日:2019-05-31
Applicant: 百度在线网络技术(北京)有限公司 , 上海小度技术有限公司
Abstract: 本申请提出一种电子设备的语音控制方法、装置、计算机设备和存储介质,其中,方法包括:通过接收用户的第一语音指令,根据第一语音指令进入非聊天模式,启动电子设备的全双工聆听状态,在全双工聆听状态之下,获取第一类型用户指令,并识别第一类型用户指令;当第一类型用户指令为预设指令时,则执行所述第一类型用户指令;当第一类型用户指令不为预设指令时,则不执行第一类型用户指令。由此,进入非聊天模式之后启动电子设备的全双工聆听状态,直接对不具有唤醒词的第一类型用户指令进行识别,并且第一类型用户指令为预设指令才执行,节约用户语音发起指令成本,保证电子设备正常播放语音,提升用户使用体验。
-
公开(公告)号:CN113626778B
公开(公告)日:2024-04-02
申请号:CN202010383104.0
申请日:2020-05-08
Applicant: 百度在线网络技术(北京)有限公司 , 上海小度技术有限公司
IPC: G06F21/31 , G06F21/32 , G06F9/4401
Abstract: 本公开的实施例涉及用于唤醒设备的方法、装置、电子设备和计算机存储介质,涉及人机交互领域。根据该方法,获取与电子设备周围的环境有关的图像,确定所获取的图像中的眼部特征是否满足注视条件,以及如果确定眼部特征满足注视条件,则基于当前时刻和电子设备的唤醒历史,唤醒电子设备。由此,能够基于注视检测和唤醒历史来唤醒设备,避免了单纯注视检测造成的设备误唤醒,提高设备唤醒准确率。
-
公开(公告)号:CN112669831B
公开(公告)日:2022-10-21
申请号:CN201910933124.8
申请日:2019-09-29
Applicant: 百度在线网络技术(北京)有限公司 , 上海小度技术有限公司
Abstract: 本申请公开了语音识别控制方法、装置、电子设备和可读存储介质,涉及人工智能和语音识别领域。具体实现方案为:探测到调用目标场景相关的应用程序接口,则查询第一工作状态的配置信息,以确定目标场景是否适用第一工作状态;若目标场景适用第一工作状态,将执行的第二工作状态切换为第一工作状态;其中,在第二工作状态下,根据唤醒词采集音频片段,对音频片段语音识别;在第一工作状态下,连续采集音频得到音频流,以对音频流语音识别。该方案中,用户可以根据自身需求,设置触发第一工作状态的场景,以满足不同用户的个性化需求,且只有在目标场景适用第一工作状态时,才控制设备进入第一工作状态,可以降低对用户的打扰,改善用户的使用体验。
-
公开(公告)号:CN113626778A
公开(公告)日:2021-11-09
申请号:CN202010383104.0
申请日:2020-05-08
Applicant: 百度在线网络技术(北京)有限公司 , 上海小度技术有限公司
IPC: G06F21/31 , G06F21/32 , G06F9/4401
Abstract: 本公开的实施例涉及用于唤醒设备的方法、装置、电子设备和计算机存储介质,涉及人机交互领域。根据该方法,获取与电子设备周围的环境有关的图像,确定所获取的图像中的眼部特征是否满足注视条件,以及如果确定眼部特征满足注视条件,则基于当前时刻和电子设备的唤醒历史,唤醒电子设备。由此,能够基于注视检测和唤醒历史来唤醒设备,避免了单纯注视检测造成的设备误唤醒,提高设备唤醒准确率。
-
-
-
-
-
-
-
-
-