-
公开(公告)号:CN109961792A
公开(公告)日:2019-07-02
申请号:CN201910160480.0
申请日:2019-03-04
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本公开的实施例公开了用于识别语音的方法和装置。该方法的一具体实施方式包括:响应于接收到用户输入的语音,检测当前网络状态;若当前网络状态良好,则将语音发送给语音识别服务器,以接收所述语音识别服务器返回的识别文字结果;将识别文字结果与本地预解析指令集进行匹配;若匹配成功,则执行识别文字结果对应的指令。该实施方式实现了离线在线混合语音识别,从而提高了语音识别速度。
-
公开(公告)号:CN109920432A
公开(公告)日:2019-06-21
申请号:CN201910163304.2
申请日:2019-03-05
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明实施例提出一种语音识别方法、装置、设备及存储介质,其中方法包括:接收语音数据,对所述语音数据进行语音识别,得到所述语音数据对应的第一文本数据;判断预先设置的固定数据表中是否存在与所述第一文本数据的发音相似度达到预设条件的常用文本数据;所述常用文本数据为出现次数超过预设阈值的语音识别结果;如果存在,则采用所述常用文本数据替换所述第一文本数据。发明实施例能够提高语音识别的准确率。
-
公开(公告)号:CN109286875A
公开(公告)日:2019-01-29
申请号:CN201811148552.1
申请日:2018-09-29
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本公开的实施例提供了一种用于定向拾音的方法、装置、电子设备和存储介质。在该方法中,生成包括音频信号和音频信号的多个瞬时到达方向值的音频数据流,音频信号与麦克风阵列从声源接收的声学信号相对应,瞬时到达方向值指示声学信号到达麦克风阵列的瞬时方向;确定音频信号中是否包括预定的语音指令;响应于确定音频信号包括语音指令,基于多个瞬时到达方向值来获得音频信号的实际到达方向值,实际到达方向值指示声学信号到达麦克风阵列的实际方向;以及基于实际到达方向值,使麦克风阵列形成指向实际方向的定向拾音波束。本公开的实施例通过将智能设备的唤醒功能和定向拾音功能相结合而实现动态的定向拾音,从而改进拾音效果并提升用户体验。
-
公开(公告)号:CN109192203A
公开(公告)日:2019-01-11
申请号:CN201811147010.2
申请日:2018-09-29
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L15/20 , G10L15/26 , G10L21/0216 , G10L21/0272
Abstract: 本发明实施例提出一种多音区语音识别方法、装置及计算机可读存储介质。其中多音区语音识别方法包括:使用麦克风模组收集语音采集环境中的语音,其中,预先为所述麦克风模组中的每个麦克风设置目标音区,所述目标音区是预先设定的所述语音采集环境中的多个独立音区中的一个;判断所述语音是否来自目标音区;对来自除所述目标音区之外的其他音区的语音进行抑制;对抑制后的语音进行识别。本发明实施例使用麦克风模组隔离出不同音区,通过隔离出多个音区实现了语音采集环境内全员使用语音,并且每个音区隔离度能达到15-20dB,实现了理想的隔离效果。
-
公开(公告)号:CN108986790A
公开(公告)日:2018-12-11
申请号:CN201811148211.4
申请日:2018-09-29
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请实施例公开了语音识别联系人的方法和装置。该方法的一具体实施方式包括:对接收到的语音查询式进行语音识别,从识别结果中提取出用于标识所查询的目标联系人的目标标识对应的音素序列;将目标标识对应的音素序列与用于标识预设联系人集合中的预设联系人的联系人标识对应的音素组合进行匹配,根据匹配结果从预设联系人集合中确定出语音查询式所查询的目标联系人。该实施方式提升了离线语音识别的效率和精度。
-
公开(公告)号:CN104216788B
公开(公告)日:2018-09-07
申请号:CN201410448920.X
申请日:2014-09-04
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F9/54
Abstract: 本发明实施例公开了一种功能处理的实现方法和装置。所述方法包括:智能终端中的应用端获取第一功能处理请求;所述应用端根据所述第一功能处理请求确定所述智能终端中的本地客户端;所述应用端根据所述第一功能处理请求向所述本地客户端发送第二功能处理请求,以指示所述本地客户端进行功能处理。本发明解决了传统的应用软件提供的单一服务已经无法满足人们日益增强的个性化、便捷化的需求的技术问题,实现了根据应用端与本地客户端建立的交互接口,在应用端接收到设定的用户请求后,可以指示本地客户端完成设定的处理功能的技术效果,大大减少了用户的人工操作,提高了功能的执行效率,提高了用户体验。
-
公开(公告)号:CN106790486A
公开(公告)日:2017-05-31
申请号:CN201611147561.X
申请日:2016-12-13
Applicant: 百度在线网络技术(北京)有限公司
CPC classification number: G06F3/1454 , H04L67/36
Abstract: 本申请公开了显示方法和装置。上述方法的一具体实施方式包括:接收车载终端发送的显示请求,其中,上述显示请求包括安装于移动终端的目标应用的应用标识;响应于接收到上述显示请求,确定上述目标应用是否处于运行状态,并为上述目标应用设置存储空间;响应于上述目标应用处于运行状态,开始绘制运行中的上述目标应用的界面,并将绘制得到的界面数据存储至上述存储空间;将存储的界面数据进行视频编码生成视频流;发送生成的视频流至上述车载终端,以供上述车载终端根据上述视频流显示上述目标应用的界面。该实施方式实现了在车载终端显示目标应用的界面时,不受目标应用在移动终端的运行状态的影响。
-
公开(公告)号:CN109192203B
公开(公告)日:2021-08-10
申请号:CN201811147010.2
申请日:2018-09-29
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L15/20 , G10L15/26 , G10L21/0216 , G10L21/0272
Abstract: 本发明实施例提出一种多音区语音识别方法、装置及计算机可读存储介质。其中多音区语音识别方法包括:使用麦克风模组收集语音采集环境中的语音,其中,预先为所述麦克风模组中的每个麦克风设置目标音区,所述目标音区是预先设定的所述语音采集环境中的多个独立音区中的一个;判断所述语音是否来自目标音区;对来自除所述目标音区之外的其他音区的语音进行抑制;对抑制后的语音进行识别。本发明实施例使用麦克风模组隔离出不同音区,通过隔离出多个音区实现了语音采集环境内全员使用语音,并且每个音区隔离度能达到15‑20dB,实现了理想的隔离效果。
-
公开(公告)号:CN109256125A
公开(公告)日:2019-01-22
申请号:CN201811151463.2
申请日:2018-09-29
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请实施例公开了一种语音的离线识别方法、装置与存储介质,苏送方法包括:获取语音指令,并将所述语音指令转换成待识别文字;判断辞典中是否存在与所述待识别文字匹配的控制指令,所述辞典包括预设的N个控制指令;若所述辞典中不包括与所述待识别文字匹配的控制指令,则从多个预设的句式模板中查找与所述待识别文字匹配的目标句式模板;根据所述目标句式模板确定所述待识别文字的意图。即本实施例的方法,在辞典匹配失败之后,进行句式模板的匹配,进而提高了匹配的成功率,提高用户语音识别的体验。
-
公开(公告)号:CN107273083A
公开(公告)日:2017-10-20
申请号:CN201710527313.6
申请日:2017-06-30
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F3/14
Abstract: 本发明实施例公开了一种终端设备之间的交互方法、装置、设备和存储介质,该方法包括:本端设备获取对端设备的显示屏幕参数;根据所述显示屏幕参数,设置所述本端设备的虚拟显示器的显示参数;根据所述虚拟显示器的显示参数,调整所述本端设备的用户界面中插件要素的参数,并生成对端用户界面;将所述对端用户界面传输给所述对端设备,进行显示。在本发明实施例的技术方案中,通过获取对端设备显示屏幕参数,从而设计专门的用户界面及其布局规则,再投射到对端设备显示,能够使得生成的图像与对端设备的显示屏更加匹配,避免失真和图像扭曲现象发生,提升了用户体验。
-
-
-
-
-
-
-
-
-