-
公开(公告)号:CN114244821B
公开(公告)日:2023-03-14
申请号:CN202111545130.X
申请日:2021-12-16
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了一种数据处理方法、装置、设备、电子设备和存储介质,涉及数据处理技术领域,尤其涉及信息流技术领域。具体实现方案为:接收第一数据包,其中,第一数据包是基于预设协议对指令数据进行封装得到的;响应于指令数据的执行操作,获取指令数据的执行数据;基于预设协议对执行数据进行封装,生成第二数据包;发送第二数据包至语音交互系统。容易注意到的是,本公开在的数据包都采用了预设协议进行封装,无需进行各个采用不同协议的模块之间的适配工作,解决了相关技术中开发效率低的技术问题,进而达到了提高开发效率的技术效果。
-
公开(公告)号:CN114389860B
公开(公告)日:2022-11-15
申请号:CN202111599638.8
申请日:2021-12-24
Applicant: 北京百度网讯科技有限公司
Abstract: 本申请公开了一种语音通信方法及其装置,涉及语音技术领域,尤其涉及语音识别及语音合成领域,具体实现方案为:向语音服务端发送基于安全语音链路连接请求,连接请求至少包括语音客户端支持的加密套件;接收语音服务端返回的响应消息,并基于响应消息对语音服务端进行验证;响应于语音服务端验证通过,基于加密套件中分组密码标准SM4算法生成第一会话密钥;基于第一会话密钥,确定完成语音客户端与语音服务端之间的安全语音链路,并基于安全语音链路,在语音客户端与语音服务端之间进行语音通信。本申请可以提高整个语音网络链路的安全性。
-
公开(公告)号:CN114327041A
公开(公告)日:2022-04-12
申请号:CN202111428469.1
申请日:2021-11-26
Applicant: 北京百度网讯科技有限公司
Abstract: 本申请公开了一种智能座舱的多模态交互方法、系统及具有其的智能座舱,涉及数据处理领域,具体涉及语音技术领域。具体实现方案为:获取智能座舱的座舱状态信息;将座舱状态信息映射为对应的识别文本;根据识别文本,获取对应的话术文本、话术语音、虚拟生命形象的面部数据和动作数据;根据话术语音、虚拟生命形象的面部数据和动作数据,生成目标虚拟生命形象的渲染画面,并在第一显示设备上播放目标虚拟生命形象的渲染画面,在第二显示设备上显示话术文本。本申请可通过目标虚拟生命形象的表情、动作、语音、文字实现人机之间多模态交互方法,使得智能座舱内的人机交互过程更加接近人人交互。
-
公开(公告)号:CN114203204A
公开(公告)日:2022-03-18
申请号:CN202111480838.1
申请日:2021-12-06
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了一种尾点检测方法、装置、设备和存储介质,涉及人工智能技术领域,尤其涉及语音识别技术领域。具体实现方案为:获取目标音频;识别所述目标音频的句式类型;根据所述句式类型,确定检测等待时长;根据所述检测等待时长,确定尾点检测结果,提高了尾点检测的准确度。
-
公开(公告)号:CN114446300B
公开(公告)日:2023-03-24
申请号:CN202210144215.5
申请日:2022-02-17
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了一种多音区识别方法、装置、设备以及存储介质。涉及车联网技术领域,具体涉及语音识别领域。具体实现方案为:分别确定唤醒识别和问询识别对应的方位信息;根据唤醒识别和问询识别分别对应的方位信息,确定唤醒识别与问询识别的方位对比结果;根据方位对比结果,从唤醒识别对应的唤醒音区和问询识别对应的问询音区中确定出目标音区,上传目标音区采集的音频。根据本公开的技术方案,能提高问询内容识别的准确率和效率。
-
公开(公告)号:CN114446300A
公开(公告)日:2022-05-06
申请号:CN202210144215.5
申请日:2022-02-17
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了一种多音区识别方法、装置、设备以及存储介质。涉及车联网技术领域,具体涉及语音识别领域。具体实现方案为:分别确定唤醒识别和问询识别对应的方位信息;根据唤醒识别和问询识别分别对应的方位信息,确定唤醒识别与问询识别的方位对比结果;根据方位对比结果,从唤醒识别对应的唤醒音区和问询识别对应的问询音区中确定出目标音区,上传目标音区采集的音频。根据本公开的技术方案,能提高问询内容识别的准确率和效率。
-
公开(公告)号:CN114389860A
公开(公告)日:2022-04-22
申请号:CN202111599638.8
申请日:2021-12-24
Applicant: 北京百度网讯科技有限公司
Abstract: 本申请公开了一种语音通信方法及其装置,涉及语音技术领域,尤其涉及语音识别及语音合成领域,具体实现方案为:向语音服务端发送基于安全语音链路连接请求,连接请求至少包括语音客户端支持的加密套件;接收语音服务端返回的响应消息,并基于响应消息对语音服务端进行验证;响应于语音服务端验证通过,基于加密套件中分组密码标准SM4算法生成第一会话密钥;基于第一会话密钥,确定完成语音客户端与语音服务端之间的安全语音链路,并基于安全语音链路,在语音客户端与语音服务端之间进行语音通信。本申请可以提高整个语音网络链路的安全性。
-
公开(公告)号:CN114187903A
公开(公告)日:2022-03-15
申请号:CN202111339114.5
申请日:2021-11-12
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了语音交互的方法、装置、电子设备及可读存储介质,涉及计算机技术领域,具体涉及语音技术、自然语言处理等人工智能技术领域。一种具体实现方案为:响应于接收到用户发送的请求语句,从本地存储模块中获取历史信息,并将所述请求语句与所述历史信息发送给服务器;接收所述服务器返回的答复语句和所述请求语句对应的当前上文信息;播放所述答复语句,并将所述当前上文信息作为历史信息存储在所述存储模块中。
-
公开(公告)号:CN113674742A
公开(公告)日:2021-11-19
申请号:CN202110948729.1
申请日:2021-08-18
Applicant: 北京百度网讯科技有限公司
Inventor: 吴震 , 革家象 , 王潇 , 苏显泽 , 刘兵 , 王佳伟 , 王丹 , 杨松 , 郝景灏 , 吴玉芳 , 瞿琴 , 张丙奇 , 付晓寅 , 吴思远 , 李超 , 高聪 , 贾磊
Abstract: 本公开提供了人机交互方法、装置、设备以及存储介质,涉及深度学习、语音等人工智能领域。具体实现方案为:获取语音指令;对所述语音指令进行语音识别,确定对应的语音文本;响应于满足预设的信息发送条件,将所述语音文本发送至云端;接收从云端返回的针对所述语音指令的资源;根据所述资源,对所述语音指令进行响应。本实现方式可以提高语音交互的效率,从而提高用户的交互体验。
-
公开(公告)号:CN112667255A
公开(公告)日:2021-04-16
申请号:CN202011405311.8
申请日:2020-12-02
Applicant: 北京百度网讯科技有限公司
Abstract: 本申请公开了一种更新方法、装置、电子设备及存储介质,涉及语音、深度学习等人工智能技术领域。具体实现方案为:语音SDK从服务器端获取到用于对语音识别算法进行更新的更新包后,根据更新包涉及的更新内容,向目标应用程序发送对应的算法更新消息,以触发目标应用程序调用语音识别算法,响应于目标应用程序的调用,加载更新包以得到更新后的语音识别算法,并采用更新后的语音识别算法进行语音识别。相较于现有技术中通过对应用程序进行升级以实现算法更新,存在更新周期长,错误率高等问题,由语音SDK触发应用程序调用语音识别算法,以加载更新包更新语音识别算法,无需对应用程序进行升级,即可实现对算法的更新,有利于提高算法更新的速度。
-
-
-
-
-
-
-
-
-