-
公开(公告)号:CN114203204A
公开(公告)日:2022-03-18
申请号:CN202111480838.1
申请日:2021-12-06
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了一种尾点检测方法、装置、设备和存储介质,涉及人工智能技术领域,尤其涉及语音识别技术领域。具体实现方案为:获取目标音频;识别所述目标音频的句式类型;根据所述句式类型,确定检测等待时长;根据所述检测等待时长,确定尾点检测结果,提高了尾点检测的准确度。
-
公开(公告)号:CN114220430A
公开(公告)日:2022-03-22
申请号:CN202111521161.1
申请日:2021-12-13
Applicant: 北京百度网讯科技有限公司
IPC: G10L15/22 , G10L15/20 , G10L21/0208 , G10L15/05 , G10L15/02
Abstract: 本公开提供了一种多音区语音交互方法、装置、设备以及存储介质,涉及人工智能技术领域,具体为自然语言处理、语音识别和深度学习技术。该方法包括:接收多个待识别音区中的至少一个待识别音区的语音信号;确定至少一个待识别音区的音区标识,采用音区标识对应的音频处理线程对语音信号进行处理,得到处理结果;执行处理结果对应的操作。基于本公开提供的多音区语音交互方法可以同时对多个音区内的语音进行并行识别,互不干扰。
-
公开(公告)号:CN114495923A
公开(公告)日:2022-05-13
申请号:CN202111625375.3
申请日:2021-12-28
Applicant: 北京百度网讯科技有限公司
IPC: G10L15/22 , G10L21/0208 , G10L21/0272 , G10L25/30
Abstract: 本公开提供了智能控制系统实现方法、装置、电子设备及存储介质,涉及智能语音、深度学习以及智能交通等人工智能领域,其中的方法可包括:利用智能控制系统中的语音芯片完成第一语音前端处理功能;利用智能控制系统中的主控处理器完成第二语音前端处理功能;其中,第一语音前端处理功能和第二语音前端处理功能共同组成智能控制系统的语音前端处理功能,且,第一语音前端处理功能和第二语音前端处理功能为不同的语音前端处理功能。应用本公开所述方案,可减轻主控处理器的算力压力,提升语音交互效果等。
-
公开(公告)号:CN114242056A
公开(公告)日:2022-03-25
申请号:CN202111547587.4
申请日:2021-12-16
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了一种语音交互方法、装置、设备、存储介质及程序产品,涉及人工智能技术领域,尤其涉及语音技术领域、自然语言处理技术领域、深度学习技术领域。具体实现方案为:监测目标驾舱是否满足语音交互模式的切换条件,语音交互模式包括舱内语音交互模式和舱外语音交互模式;若确定满足语音交互模式的切换条件,则将语音交互模式从当前语音交互模式切换为另一种语音交互模式;采用另一种语音交互模式与目标用户进行语音交互。本公开能够在满足语音交互模式的切换条件时,实现对语音交互模式之间的切换,而且能够实现与用户的多种语音交互方式,全方位的满足用户的语音交互需求。
-
公开(公告)号:CN114203204B
公开(公告)日:2024-04-05
申请号:CN202111480838.1
申请日:2021-12-06
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了一种尾点检测方法、装置、设备和存储介质,涉及人工智能技术领域,尤其涉及语音识别技术领域。具体实现方案为:获取目标音频;识别所述目标音频的句式类型;根据所述句式类型,确定检测等待时长;根据所述检测等待时长,确定尾点检测结果,提高了尾点检测的准确度。
-
-
-
-