语音交互方法及相关装置、设备和存储介质

    公开(公告)号:CN115359789B

    公开(公告)日:2024-10-25

    申请号:CN202210930532.X

    申请日:2022-08-02

    Inventor: 肖建辉

    Abstract: 本申请公开了一种语音交互方法及相关装置、设备和存储介质,其中,语音交互方法包括:响应于检测到语音交互的开启请求,基于拍摄图像进行目标检测,确定发起开启请求的请求人所在的目标区域;基于目标区域,锁定语音交互的第一音区;其中,语音交互基于在第一音区采集的第一语音执行;重新执行基于拍摄图像进行目标检测,确定发起开启请求的请求人所在的目标区域的步骤以及后续步骤。上述方案,能够动态锁定音区,提升语音交互的可靠性和连续性。

    语音交互方法、系统、设备及存储介质

    公开(公告)号:CN117711392A

    公开(公告)日:2024-03-15

    申请号:CN202311742909.X

    申请日:2023-12-18

    Inventor: 计超 肖建辉 袁奎

    Abstract: 本发明涉及智能语音交互技术领域,提供一种语音交互方法、系统、设备及存储介质,该方法通过确定当前识别结果在历史轮次中的重复次数,并将重复次数作为判断依据,不仅可以避免用户多次输入导致体验感降低的情况发生,还可以避免因系统超时设定导致脱离语音识别状态的情况发生,提高用户体验感。在重复次数满足大于等于第一次数的情况下,向用户提供引导信息,当接收到用户的回复信息时,基于回复信息,对当前识别结果进行更正,并对当前用户语音进行响应,保证响应结果的准确性,使响应结果更加符合用户的预期,进一步提升用户体验。

    基于语音交互的界面提示方法、装置、设备和存储介质

    公开(公告)号:CN116126442A

    公开(公告)日:2023-05-16

    申请号:CN202211742881.5

    申请日:2022-12-31

    Abstract: 本发明公开了一种基于语音交互的界面提示方法、装置、设备和存储介质,界面提示方法包括:确定显示界面中的至少一个目标控件,至少一个目标控件包括图形控件和特殊字符控件中的至少一个;获取至少一个目标控件对应的文本描述内容;在显示界面停留显示过程中的不同时段,分别对部分目标控件对应的文本描述内容进行提示,目标控件对应的文本描述内容用于引导用户在与终端进行语音交互过程中,采用终端能够识别的文字来描述目标控件。通过上述方式,可以便于用户对不易表达的目标控件进行语音描述,一定程度上提高了用户与终端之间语音交互的效果。

    语音交互方法及相关装置、语音交互设备和存储介质

    公开(公告)号:CN115374416A

    公开(公告)日:2022-11-22

    申请号:CN202210856220.9

    申请日:2022-07-19

    Inventor: 肖建辉

    Abstract: 本申请公开了一种语音交互方法及相关装置、语音交互设备和存储介质,其中,语音交互方法包括:获取待交互对象的人脸认证结果,并响应于人脸认证结果包括认证成功,将语音交互功能置为有效,且在语音交互功能的有效时段内,与待交互对象进行语音交互。上述方案,能够提升语音交互的便利性和成功率。

    语音交互方法及相关装置、设备和存储介质

    公开(公告)号:CN115359789A

    公开(公告)日:2022-11-18

    申请号:CN202210930532.X

    申请日:2022-08-02

    Inventor: 肖建辉

    Abstract: 本申请公开了一种语音交互方法及相关装置、设备和存储介质,其中,语音交互方法包括:响应于检测到语音交互的开启请求,基于拍摄图像进行目标检测,确定发起开启请求的请求人所在的目标区域;基于目标区域,锁定语音交互的第一音区;其中,语音交互基于在第一音区采集的第一语音执行;重新执行基于拍摄图像进行目标检测,确定发起开启请求的请求人所在的目标区域的步骤以及后续步骤。上述方案,能够动态锁定音区,提升语音交互的可靠性和连续性。

    语音交互方法及相关装置、设备、系统和存储介质

    公开(公告)号:CN116386639A

    公开(公告)日:2023-07-04

    申请号:CN202310091983.3

    申请日:2023-01-17

    Abstract: 本申请公开了一种语音交互方法及相关装置、设备、系统和存储介质,其中,语音交互方法包括:获取语音交互场景的拍摄图像和采集语音;基于拍摄图像进行检测,得到拍摄图像中目标对象的视线注视情况和唇部运动情况;基于唇部运动情况,从采集语音中提取目标对象的目标语音,并获取语音交互场景中交互设备的控制指令与目标语音的语义匹配情况;响应于视线注视情况包括目标对象的视线注视交互设备且存在语义匹配情况满足预设要求的控制指令,控制交互设备执行语义匹配情况满足预设要求的控制指令。上述方案,能够在语音交互之前免于语音唤醒,提升语音交互的便利性,同时提升语音交互的准确性。

    语音唤醒方法及相关装置、电子设备、存储介质

    公开(公告)号:CN115798468A

    公开(公告)日:2023-03-14

    申请号:CN202211269791.9

    申请日:2022-10-14

    Inventor: 肖建辉

    Abstract: 本申请公开了一种语音唤醒方法及相关装置、电子设备、存储介质,其中,语音唤醒方法包括:检测用户语音的唤醒置信度,并依次分析唤醒置信度分别与第一唤醒阈值、第二唤醒阈值之间的大小关系,且第一唤醒阈值小于第二唤醒阈值;响应于唤醒置信度不小于第二唤醒阈值,开启语音交互;响应于唤醒置信度不小于第一唤醒阈值且小于第二唤醒阈值,基于从用户语音提取到的第一声纹特征和语音交互系统已经存储的若干第二声纹特征,确定是否开启语音交互。上述方案,能够提升唤醒响应速度,同时提升唤醒准确性。

    语音交互方法及相关装置、电子设备、存储介质

    公开(公告)号:CN115083412B

    公开(公告)日:2023-01-17

    申请号:CN202210963381.8

    申请日:2022-08-11

    Inventor: 肖建辉

    Abstract: 本申请公开了一种语音交互方法及相关装置、电子设备、存储介质,其中,语音交互方法包括:基于待识别语音进行语音识别,得到识别文本;获取语音交互系统中多个交互子系统分别对识别文本分析得到的候选交互结果;其中,多个交互子系统相互独立且分别适用于不同交互场景,候选交互结果包括候选交互文本及其交互优先级;基于各候选交互结果中交互优先级进行结果仲裁,确定用于响应待识别语音的候选交互文本,作为目标交互文本。上述方案,能够在面临业务场景切换时,提升语音交互的灵活性,并尽可能地降低丢失继承关系的可能性,提升语音交互的准确性。

    语音处理方法及相关装置、电子设备、存储介质

    公开(公告)号:CN114898755B

    公开(公告)日:2023-01-17

    申请号:CN202210824381.X

    申请日:2022-07-14

    Abstract: 本申请公开了一种语音处理方法及相关装置、电子设备、存储介质,其中,语音处理方法包括:获取持续至当前时刻的空白语音的语音时长,并判断语音时长是否不小于首个检测时长;响应于语音时长不小于首个检测时长,基于截止至当前时刻采集到的有效语音,获取语音处理结果,并基于空白语音的端点时刻,确定参考时刻;将最新使用的检测时长的下一检测时长,作为参考时长,并判断从参考时刻开始持续采集参考时长的参考语音是否仍空白;若是且所有检测时长均已使用,则将最新获取的语音处理结果置为有效。上述方案,能够提升语音交互的响应速度。

    网络检测方法及相关装置、电子设备和存储介质

    公开(公告)号:CN119155213A

    公开(公告)日:2024-12-17

    申请号:CN202411086217.9

    申请日:2024-08-08

    Abstract: 本申请公开了一种网络检测方法及相关装置、电子设备和存储介质,其中,网络检测方法包括:选择当前触发网络服务请求的应用程序,作为目标应用;基于目标应用和可信应用集内应用程序各自最近触发网络服务请求之后分别所确定的历史网络信息,预判当前网络状态;其中,历史网络信息包括历史网络状态以及确定历史网络状态时的历史时刻;基于当前网络状态,确定目标应用的超时请求时长;其中,超时请求时长与当前网络状态所表征的网络质量正相关;基于是否在超时请求时长之内获取到目标应用的请求反馈结果,确定是否提示当前无法响应目标应用的网络服务请求。上述方案,能够提升网络状态的判断精度和应用程序的反馈速度。

Patent Agency Ranking