-
公开(公告)号:CN107622770A
公开(公告)日:2018-01-23
申请号:CN201710922732.X
申请日:2017-09-30
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明提出一种语音唤醒方法及装置,该方法对本地的第一声学模型识别出的所检测到的唤醒语音与预设唤醒词信号之间相似度的不高也不低的情形,可以通过云端服务器的第二声学模型进行再次识别,可以尽可能地避免终端设备误唤醒或可以唤醒却没唤醒的情形发生,提高用户的体验度。此外,对通过第一声学模型识别出的唤醒语音与预设唤醒词信号之间相识度较高的情形或相识度较低的情形,由终端设备自身决定是否执行唤醒终端设备的操作,无需发送给云端服务器进行识别,这样可以提高终端设备的执行唤醒操作的效率。
-
公开(公告)号:CN107608957A
公开(公告)日:2018-01-19
申请号:CN201710797779.8
申请日:2017-09-06
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明提出一种基于语音信息的文本修改方法、装置及其设备,其中,方法包括:对用户输入的语音信息进行转换处理,在文本框中生成对应的文本信息;对文本信息进行分词处理生成多个分词,并在应用界面显示文本修改触控面板,其中,文本修改触控面板包括:多个分词以及分词间隔位置;获取用户在文本修改触控面板中选定的目标位置;获取对目标位置的处理指令,根据处理指令进行相应的操作处理,并对文本框中的文本信息进行同步更新。由此,在语音输入时,用户对文本框中的文本信息进行更新时无需要回到手动输入面板,就可以快速完成,方便用户使用,提高语音信息交互的效率。
-
公开(公告)号:CN107544726A
公开(公告)日:2018-01-05
申请号:CN201710536744.9
申请日:2017-07-04
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F3/0481 , G06F3/0482 , G10L15/26 , G10L25/51
Abstract: 本发明公开了基于人工智能的语音识别结果纠错方法、装置及存储介质,其中方法包括:根据各用户对于语音识别结果的历史修改轨迹,确定出被修改过的字或词,作为标注对象,并分别确定出每个标注对象的评分;获取用户输入的语音的语音识别结果,确定出其中评分大于预定阈值的标记对象;将语音识别结果展示给用户,并对确定出的标记对象进行标记;当接收到用户针对任一标记对象的展示指令时,将该标记对象对应的替换候选项展示给用户,供用户从中进行选择,并用选中的替换候选项替换该标记对象。应用本发明所述方案,能够提高用户的输入效率等。
-
公开(公告)号:CN107564518B
公开(公告)日:2021-10-22
申请号:CN201710718772.2
申请日:2017-08-21
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L15/22 , G10L15/26 , G06F9/4401
Abstract: 本发明提出一种智能设备控制方法、装置及计算机设备,其中,该方法包括:对智能设备获取的语音信号进行语音识别,判断所述语音信号对应的控制指令是否与所述智能设备当前的工作场景匹配;若匹配,则根据所述控制指令对所述智能设备的工作状态进行调整。由此,无需唤醒词即可实现根据与当前工作场景匹配的控制指令对智能设备的控制,控制方式简单,提高了控制的灵活性,改善了用户体验。
-
公开(公告)号:CN107731219B
公开(公告)日:2021-07-20
申请号:CN201710797787.2
申请日:2017-09-06
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请提出一种语音合成处理方法、装置及设备,其中方法包括:对待处理的文本进行处理,确定文本的特征;根据文本的特征、当前的时间信息和/或天气信息,获取目标语音标签;根据目标语音标签,将文本进行语音合成。该方法使得播放的语音形式丰富多变,并且还能携带更多的信息,增加了语音合成的适用范围,极大的提高了用户使用体验。
-
公开(公告)号:CN107134279B
公开(公告)日:2020-06-19
申请号:CN201710525422.4
申请日:2017-06-30
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L15/22 , G10L15/30 , G10L15/32 , G10L15/197
Abstract: 本发明公开了一种语音唤醒方法、装置、终端和存储介质,属于语音识别技术领域。该方法包括:获取用于唤醒智能终端的唤醒语音;利用所述智能终端的预设声学模型和预设唤醒词识别网络,对所述唤醒语音的声学特征进行分析,获得所述唤醒语音相对预设唤醒词的声学特征的置信度;若所述置信度位于预设的中等置信度范围内,则将所述唤醒语音上传到远程服务器;若利用所述远程服务器中的语言模型对所述唤醒语音分析得到的语言特征,与所述预设唤醒词的语言特征匹配一致,则接收所述远程服务器生成的智能终端唤醒指令。本发明实施例提供的一种语音唤醒方法、装置、终端和存储介质,实现了用户对唤醒词的自定义。
-
公开(公告)号:CN109000662A
公开(公告)日:2018-12-14
申请号:CN201810795765.7
申请日:2018-07-19
Applicant: 百度在线网络技术(北京)有限公司
IPC: G01C21/20
Abstract: 本申请实施例公开了导航方法和装置。该方法的一具体实施方式包括:响应于检测到用户选取兴趣点,获取与目标路线相关联的基础导航数据,目标路线为从用户的位置到达用户选取的兴趣点的位置的路线;响应于检测到用户进行路线规划操作,判断是否满足呈现条件;当满足呈现条件时,向用户呈现路线规划结果,以及生成用于获取与目标路线相关联的增量导航数据的请求,其中,路线规划结果基于所述与目标路线相关联的基础导航数据而生成。实现了在导航过程中,可以快速对用户的路线规划操作进行响应,向用户呈现路线规划结果。
-
公开(公告)号:CN107680598A
公开(公告)日:2018-02-09
申请号:CN201710786736.X
申请日:2017-09-04
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 谢波
IPC: G10L17/00 , H04L12/58 , H04M1/2745
Abstract: 本发明提出一种基于好友声纹通讯录的信息交互方法、装置及其设备,其中,方法包括:第一设备接收第一用户发送的语音信息,对语音信息进行声纹分析处理,提取第一用户的第一声纹特征,并解析语音信息获取待进行信息交互的第二用户以及第一用户的意图;第一设备查询预存的与第一声纹特征对应的好友声纹通讯录,获取第二用户预先注册的第二声纹特征,以及与第二声纹特征对应的第二设备的通信地址;第一设备根据第一用户的意图和第二设备的通信地址与第二设备进行通信交互。由此,通过声纹唯一标识用户身份,能够高效快捷的与其他用户进行信息交互,提高了通信效率。
-
公开(公告)号:CN107657017A
公开(公告)日:2018-02-02
申请号:CN201710882420.0
申请日:2017-09-26
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 谢波
IPC: G06F17/30
Abstract: 本申请公开了用于提供语音服务的方法和装置。该用于提供语音服务的方法的一具体实施方式包括:获取语音输入信号;利用已采用机器学习方法训练的语义识别模型识别语音输入信号中的语气和说话内容,得到相应的语气输入信息和文本输入信息,其中,语气输入信息用于表示语音输入信号的语气类型;基于语气输入信息和文本输入信息进行语音服务数据查询,根据查询结果生成语音响应信息。该实施方式实现了不依赖于语气助词的语气识别,能够更准确地探测到说话人的意图,提升语音服务的精准度。
-
公开(公告)号:CN105865468A
公开(公告)日:2016-08-17
申请号:CN201610197253.1
申请日:2016-03-31
Applicant: 百度在线网络技术(北京)有限公司
IPC: G01C21/34
CPC classification number: G01C21/3415
Abstract: 本发明实施例公开了一种导航路线的刷新方法和装置。所述方法包括:依据承载导航客户端的用户终端的当前位置和当前展示的导航路线的路况信息,产生路线刷新事件;在监测到所述路线刷新事件时,依据用户终端的当前位置向所述导航服务器发送路线刷新请求;接收并展示所述导航服务器返回的新导航路线,所述新导航路线由所述导航服务器依据所述用户终端的当前位置周围的道路路况信息和导航终点确定的。本发明的技术方案,在路径导航过程中用户终端不仅展示导航路线的道路路况信息,还依据道路路况信息刷新为用户提供的导航路线,便于用户根据路况实时调整行驶路线,提高了导航方式的便捷性。
-
-
-
-
-
-
-
-
-