-
公开(公告)号:CN113936668B
公开(公告)日:2025-04-08
申请号:CN202111188936.8
申请日:2021-10-12
Applicant: 百度在线网络技术(北京)有限公司 , 上海小度技术有限公司
IPC: G10L17/26 , G10L17/18 , G06V40/16 , G10L13/047 , G10L13/04 , G10L21/043
Abstract: 本公开提供了一种用于智能语音设备的方法、装置、设备和介质,涉及计算机技术领域,尤其涉及人工智能和语音技术。实现方案为:基于用户的生物特征,确定用户的年龄区间;基于年龄区间,选择预设的第一语速参数用于播报语音;响应于识别出用户的身份,基于用户的历史语速记录,调整第一语速参数,以确定第二语速参数,其中,历史语速记录包括智能语音设备在与用户的至少一次交互中,从用户的声纹特征中提取的特定于用户的语速参数;以及基于第二语速参数播报语音。
-
公开(公告)号:CN112037786B
公开(公告)日:2024-09-24
申请号:CN202010896268.3
申请日:2020-08-31
Applicant: 百度在线网络技术(北京)有限公司 , 上海小度技术有限公司
Abstract: 本申请公开了语音交互方法、装置、设备以及存储介质,涉及智能家居、人工智能领域。具体实现方案为:实时监测用户的语音;对语音进行识别,确定语音是否包括第一预设词语;响应于确定语音包括第一预设词语,确定语音中位于第一预设词语的下文信息是否包括第二预设词语;响应于确定第一预设词语的下文信息包括第二预设词语,对第二预设词语的下文信息进行意图识别;根据意图识别结果,对设备进行控制,以响应用户。本实现方式使得设备的交互过程变得适应性更强,用户感受更加友好。
-
公开(公告)号:CN112037786A
公开(公告)日:2020-12-04
申请号:CN202010896268.3
申请日:2020-08-31
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请公开了语音交互方法、装置、设备以及存储介质,涉及智能家居、人工智能领域。具体实现方案为:实时监测用户的语音;对语音进行识别,确定语音是否包括第一预设词语;响应于确定语音包括第一预设词语,确定语音中位于第一预设词语的下文信息是否包括第二预设词语;响应于确定第一预设词语的下文信息包括第二预设词语,对第二预设词语的下文信息进行意图识别;根据意图识别结果,对设备进行控制,以响应用户。本实现方式使得设备的交互过程变得适应性更强,用户感受更加友好。
-
公开(公告)号:CN107277153A
公开(公告)日:2017-10-20
申请号:CN201710525724.1
申请日:2017-06-30
Applicant: 百度在线网络技术(北京)有限公司
IPC: H04L29/08
Abstract: 本申请公开了用于提供语音服务的方法、装置和服务器。该方法的一具体实施方式包括:接收为已接入第三方语音服务的设备端提供目标语音服务的请求消息,请求消息包括请求内容和设备端的状态信息;获取基于设备端的状态信息对请求内容进行处理后生成的响应消息,响应消息包括操作指令;向设备端发送响应消息;其中,请求消息和响应消息按照已构建的目标语音服务的数据服务框架模型中配置的消息格式生成、并基于该数据服务框架模型中配置的传输协议传输;该目标语音服务的数据服务框架模型中配置的消息格式和传输协议分别与第三方语音服务的消息格式和传输协议一致。该方法可以降低设备端接入不同语音服务的开发成本和运维成本。
-
公开(公告)号:CN111986682A
公开(公告)日:2020-11-24
申请号:CN202010896937.7
申请日:2020-08-31
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请公开了语音交互方法、装置、设备以及存储介质,涉及智能家居、人工智能领域。具体实现方案为:实时监测用户的语音;对语音进行识别,确定语音是否包括预设唤醒词的至少两个字;响应于确定语音包括预设唤醒词的至少两个字,对至少两个字的下文信息进行意图识别;根据意图识别结果,控制设备响应用户。本实现方式简化了设备的唤醒方法,提高了设备的唤醒成功率。
-
公开(公告)号:CN112101216A
公开(公告)日:2020-12-18
申请号:CN202010969565.6
申请日:2020-09-15
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请公开了人脸识别方法、装置、设备及存储介质,涉及人工智能技术领域、计算机视觉技术领域。具体实现方案为:获取待识别人脸图像;根据预先构建的人脸库,对待识别人脸图像进行识别,人脸库包括从互联网采集的多个人物的人脸图像和与多个人脸图像对应的身份标识。因此,通过从互联网采集的人脸库实现对网络上特定群体的人脸识别,无需进行复杂的用户人脸和身份信息注册等复杂的操作过程,扩展人脸识别的应用场所。
-
公开(公告)号:CN107277153B
公开(公告)日:2020-05-26
申请号:CN201710525724.1
申请日:2017-06-30
Applicant: 百度在线网络技术(北京)有限公司
IPC: H04L29/08
Abstract: 本申请公开了用于提供语音服务的方法、装置和服务器。该方法的一具体实施方式包括:接收为已接入第三方语音服务的设备端提供目标语音服务的请求消息,请求消息包括请求内容和设备端的状态信息;获取基于设备端的状态信息对请求内容进行处理后生成的响应消息,响应消息包括操作指令;向设备端发送响应消息;其中,请求消息和响应消息按照已构建的目标语音服务的数据服务框架模型中配置的消息格式生成、并基于该数据服务框架模型中配置的传输协议传输;该目标语音服务的数据服务框架模型中配置的消息格式和传输协议分别与第三方语音服务的消息格式和传输协议一致。该方法可以降低设备端接入不同语音服务的开发成本和运维成本。
-
公开(公告)号:CN114005444A
公开(公告)日:2022-02-01
申请号:CN202111269084.5
申请日:2021-10-29
Applicant: 百度在线网络技术(北京)有限公司 , 上海小度技术有限公司
Abstract: 本公开提供了一种语音控制方法、装置及电子设备,涉及智能语音设备技术领域,尤其涉及语音交互技术领域。具体实现方案为:第一设备接收用户的语音指令,所述语音指令包括设备标签及设备控制指令;确定与所述设备标签对应的第二设备,向所述第二设备发送所述设备控制指令,所述设备控制指令用于控制所述第二设备执行目标操作,或者用于控制所述第一设备和所述第二设备执行目标操作。
-
公开(公告)号:CN113936668A
公开(公告)日:2022-01-14
申请号:CN202111188936.8
申请日:2021-10-12
Applicant: 百度在线网络技术(北京)有限公司 , 上海小度技术有限公司
IPC: G10L17/26 , G10L17/18 , G06V40/16 , G10L13/047 , G10L13/04 , G10L21/043
Abstract: 本公开提供了一种用于智能语音设备的方法、装置、设备和介质,涉及计算机技术领域,尤其涉及人工智能和语音技术。实现方案为:基于用户的生物特征,确定用户的年龄区间;基于年龄区间,选择预设的第一语速参数用于播报语音;响应于识别出用户的身份,基于用户的历史语速记录,调整第一语速参数,以确定第二语速参数,其中,历史语速记录包括智能语音设备在与用户的至少一次交互中,从用户的声纹特征中提取的特定于用户的语速参数;以及基于第二语速参数播报语音。
-
公开(公告)号:CN112037794A
公开(公告)日:2020-12-04
申请号:CN202010897825.3
申请日:2020-08-31
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L15/26 , G10L15/22 , G10L15/183 , G06F40/30
Abstract: 本申请公开了语音交互方法、装置、设备以及存储介质,涉及智能家居、人工智能领域。具体实现方案为:实时监测用户的语音;对语音进行识别,确定语音是否包括预设词语;响应于确定语音包括预设词语,确定语音是否包括预设词语的上文信息;响应于确定语音不包括预设词语的上文信息,对预设词语的下文信息进行意图识别;根据意图识别结果,控制设备响应用户。本实现方式简化了用户与设备的交互步骤,优化了用户体验。
-
-
-
-
-
-
-
-
-