-
公开(公告)号:CN113495622A
公开(公告)日:2021-10-12
申请号:CN202010261346.2
申请日:2020-04-03
申请人: 百度在线网络技术(北京)有限公司 , 上海小度技术有限公司
IPC分类号: G06F3/01 , G06F3/0484 , G06F3/0485 , G10L15/22 , G10L15/26
摘要: 本申请公开了一种交互模式的切换方法、装置、电子设备及存储介质,涉及智能交互技术领域。切换方法的具体实现方案为:在带屏语音交互设备处于多项交互模式的情况下,启动计时;其中,所述多项交互模式为支持显示语音交互信息和触控交互的模式;在到达预定时间的情况下,将所述带屏语音交互设备切换至触控交互模式。通过上述方案,可以自动进行交互模式的切换。尤其针对视频场景,可以避免持续显示语音交互信息带给用户不良的体验。从而可以从整体上提升用户的交互满意度。
-
公开(公告)号:CN113495620A
公开(公告)日:2021-10-12
申请号:CN202010260824.8
申请日:2020-04-03
申请人: 百度在线网络技术(北京)有限公司 , 上海小度技术有限公司
IPC分类号: G06F3/01 , G06F3/0484 , G06F3/0485 , G10L15/22 , G10L15/26
摘要: 本申请公开了一种交互模式的切换方法、装置、电子设备及存储介质,涉及智能交互技术领域。切换方法的具体实现方案为:在带屏语音交互设备处于多项交互模式的情况下,根据第一切换指令,将带屏语音交互设备切换至触控交互模式;多项交互模式为支持显示语音交互信息和触控交互的模式;在触控交互模式,根据触控指令的接收时间,确定有效的第二切换指令;第二切换指令为将带屏语音交互设备切换至多项交互模式的指令。本申请利用多项交互模式可以支持在显示语音交互信息的同时,执行用户的动作指令。根据切换指令的接收时间确定有效的切换指令,可以避免无效切换指令导致的频繁切换,从而可以准确的识别用户的切换意图,提高交互感受。
-
公开(公告)号:CN112017651B
公开(公告)日:2024-06-04
申请号:CN201910468935.5
申请日:2019-05-31
申请人: 百度在线网络技术(北京)有限公司 , 上海小度技术有限公司
摘要: 本申请提出一种电子设备的语音控制方法、装置、计算机设备和存储介质,其中,方法包括:通过接收用户的第一语音指令,根据第一语音指令进入非聊天模式,启动电子设备的全双工聆听状态,在全双工聆听状态之下,获取第一类型用户指令,并识别第一类型用户指令;当第一类型用户指令为预设指令时,则执行所述第一类型用户指令;当第一类型用户指令不为预设指令时,则不执行第一类型用户指令。由此,进入非聊天模式之后启动电子设备的全双工聆听状态,直接对不具有唤醒词的第一类型用户指令进行识别,并且第一类型用户指令为预设指令才执行,节约用户语音发起指令成本,保证电子设备正常播放语音,提升用户使用体验。
-
公开(公告)号:CN112669831B
公开(公告)日:2022-10-21
申请号:CN201910933124.8
申请日:2019-09-29
申请人: 百度在线网络技术(北京)有限公司 , 上海小度技术有限公司
摘要: 本申请公开了语音识别控制方法、装置、电子设备和可读存储介质,涉及人工智能和语音识别领域。具体实现方案为:探测到调用目标场景相关的应用程序接口,则查询第一工作状态的配置信息,以确定目标场景是否适用第一工作状态;若目标场景适用第一工作状态,将执行的第二工作状态切换为第一工作状态;其中,在第二工作状态下,根据唤醒词采集音频片段,对音频片段语音识别;在第一工作状态下,连续采集音频得到音频流,以对音频流语音识别。该方案中,用户可以根据自身需求,设置触发第一工作状态的场景,以满足不同用户的个性化需求,且只有在目标场景适用第一工作状态时,才控制设备进入第一工作状态,可以降低对用户的打扰,改善用户的使用体验。
-
公开(公告)号:CN113495621A
公开(公告)日:2021-10-12
申请号:CN202010261062.3
申请日:2020-04-03
申请人: 百度在线网络技术(北京)有限公司 , 上海小度技术有限公司
IPC分类号: G06F3/01 , G06F3/0484 , G06F3/0485 , G10L15/22 , G10L15/26
摘要: 本申请公开了一种交互模式的切换方法、装置、电子设备及存储介质,涉及智能交互技术领域。切换方法的具体实现方案为:在带屏语音交互设备处于触控交互模式的情况下,根据第一切换指令,切换至多项交互模式;多项交互模式为支持显示语音交互信息和触控交互模式;在多项交互模式的情况下,带屏语音交互设备的第一屏幕区域为显示语音交互信息的区域,第二屏幕区域为响应触控指令的区域;在触控交互模式的情况下,带屏语音交互设备的第一、第二屏幕区域为响应触控指令的区域。通过上述方案,采用了多项交互模式的机制,可以满足用户的交互需求,提升交互体验。
-
公开(公告)号:CN112581946B
公开(公告)日:2024-08-16
申请号:CN201910933815.8
申请日:2019-09-29
申请人: 百度在线网络技术(北京)有限公司 , 上海小度技术有限公司
IPC分类号: G10L15/22
摘要: 本申请公开了语音控制方法、装置、电子设备和可读存储介质,涉及语音识别领域。具体实现方案为:根据展示页面可响应的语音指令,确定第一引导词,获取展示页面所属前台程序可响应的语音指令,根据前台程序可响应的语音指令,以及根据后台程序可响应的语音指令,确定第二引导词,在目标工作状态下,提示第一引导词和第二引导词;其中,目标工作状态,用于连续采集音频得到音频流,并获取音频流语音识别得到的信息流,以根据信息流进行语音控制。由此,通过在目标状态下提示第一引导词和第二引导词,用户根据第一引导词和第二引导词与电子设备进行语音交互时,无需重复输入唤醒词,可以简化用户操作,改善用户的使用体验。
-
公开(公告)号:CN112017650B
公开(公告)日:2024-05-24
申请号:CN201910468915.8
申请日:2019-05-31
申请人: 百度在线网络技术(北京)有限公司 , 上海小度技术有限公司
摘要: 本申请提出一种电子设备的语音控制方法、装置、计算机设备和存储介质,其中,方法包括:通过接收用户的第一语音指令进入音乐模式;进入音乐模式之后预定时间段内启动电子设备的全双工聆听状态,在全双工聆听状态之下获取第一类型用户指令并识别;第一类型用户指令与音乐模式相关执行第一类型用户指令;第一类型用户指令与音乐模式不相关不执行第一类型用户指令;在预定时间段之后,退出全双工聆听状态。由此,进入音乐模式之后预定时间段内,启动电子设备的全双工聆听状态,直接对不具有唤醒词的第一类型用户指令进行识别,并且第一类型用户指令与音乐模式相关才执行,节约用户语音发起指令成本,保证电子设备正常播放语音,提升用户使用体验。
-
公开(公告)号:CN112530419B
公开(公告)日:2024-05-24
申请号:CN201910888231.3
申请日:2019-09-19
申请人: 百度在线网络技术(北京)有限公司 , 上海小度技术有限公司
IPC分类号: G10L15/22
摘要: 本申请公开了语音识别控制方法、装置、电子设备和可读存储介质,涉及人工智能和语音识别领域。具体实现方案为:在第一工作状态下,探测具有设定控制意图的目标操作;其中,第一工作状态下,根据唤醒词采集音频片段,以进行语音识别;若探测到目标操作,执行目标操作对应的控制指令,并将第一工作状态切换为第二工作状态;在第二工作状态下,连续采集音频得到音频流,以进行语音识别。该方案中,用户只需触发具有设定控制意图的目标操作,即可实现与电子设备进行连续交互,而无需连续输入唤醒词,可以简化用户操作,改善用户的使用体验。
-
公开(公告)号:CN112581969A
公开(公告)日:2021-03-30
申请号:CN201910933027.9
申请日:2019-09-29
申请人: 百度在线网络技术(北京)有限公司
摘要: 本申请公开了语音控制方法、装置、电子设备和可读存储介质,涉及语音识别领域。具体实现方案为:通过执行第一工作状态,以根据唤醒词采集音频片段,获取对音频片段的第一控制意图,执行与第一控制意图匹配的控制指令,并将执行的第一工作状态切换为第二工作状态,以在用户设定时长内连续采集音频得到音频流,获取音频流的第二控制意图,执行与第二控制意图匹配的控制指令。由此,用户只需在用户设定时长内连续输入音频流,即可实现与电子设备进行连续交互,而无需连续输入唤醒词,可以简化用户操作,满足不同类型的用户需求,改善用户的使用体验。
-
公开(公告)号:CN112017651A
公开(公告)日:2020-12-01
申请号:CN201910468935.5
申请日:2019-05-31
申请人: 百度在线网络技术(北京)有限公司
摘要: 本申请提出一种电子设备的语音控制方法、装置、计算机设备和存储介质,其中,方法包括:通过接收用户的第一语音指令,根据第一语音指令进入非聊天模式,启动电子设备的全双工聆听状态,在全双工聆听状态之下,获取第一类型用户指令,并识别第一类型用户指令;当第一类型用户指令为预设指令时,则执行所述第一类型用户指令;当第一类型用户指令不为预设指令时,则不执行第一类型用户指令。由此,进入非聊天模式之后启动电子设备的全双工聆听状态,直接对不具有唤醒词的第一类型用户指令进行识别,并且第一类型用户指令为预设指令才执行,节约用户语音发起指令成本,保证电子设备正常播放语音,提升用户使用体验。
-
-
-
-
-
-
-
-
-