-
公开(公告)号:CN107240396B
公开(公告)日:2023-01-17
申请号:CN201710457375.4
申请日:2017-06-16
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明实施例公开了一种说话人自适应方法、装置、设备及存储介质。所述说话人自适应方法包括:获取目标说话人的第一语音数据;将所述第一语音数据输入预先训练得到的批规范化BN网络中进行自适应训练,得到包含所述目标说话人语音参数的语音识别模型。本发明实施例通过将目标说话人的第一语音数据输入预先训练得到的批规范化BN网络中进行自适应训练,得到包含所述目标说话人语音参数的语音识别模型,可以简化说话人自适应过程,降低自适应复杂度,提高自适应性能。
-
公开(公告)号:CN109218062A
公开(公告)日:2019-01-15
申请号:CN201710552058.0
申请日:2017-07-07
Applicant: 百度在线网络技术(北京)有限公司
IPC: H04L12/24
CPC classification number: H04L41/06 , H04L41/0613
Abstract: 本申请公开了基于置信区间的互联网业务报警方法和装置。所述方法的一具体实施方式包括:获取当前时段的互联网业务数据信息,互联网业务数据信息包括互联网业务量信息、互联网业务类型信息和时间特征信息;基于互联网业务类型信息和时间特征信息,确定与当前时段的互联网业务数据信息匹配的报警模型;判断互联网业务量信息所指示的互联网业务量是否满足至少一个预设条件;若不满足,则生成报警信息;其中,预设条件包括:互联网业务量信息所指示的互联网业务量处于与互联网业务量信息相对应的报警模型的置信区间内。该实施方式针对不同时段、不同时间特征的互联网业务设置针对性的报警模型和报警触发条件,使得报警更加准确。
-
公开(公告)号:CN107293296B
公开(公告)日:2020-11-20
申请号:CN201710508531.5
申请日:2017-06-28
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明实施例公开了一种语音识别结果纠正方法、装置、设备及存储介质。所述语音识别结果纠正方法包括:对获取的语音数据进行语音识别,得到初始文本信息;采用神经机器翻译NMT模型对所述初始文本信息进行识别纠正,得到最终的文本识别结果。本发明实施例通过采用神经机器翻译NMT模型对语音识别得到的初始文本信息,进行再次识别纠正,能够得到较为准确的文本识别结果,可以提高语音识别的准确率。
-
公开(公告)号:CN109214846A
公开(公告)日:2019-01-15
申请号:CN201710536661.X
申请日:2017-07-04
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请公开了信息存储方法和装置。该方法的一具体实施方式包括:对所提取的多个用户的历史操作数据进行解析,确定与每一个用户相对应的至少一个操作行为序列;对于所确定的每一个操作行为序列,确定预设操作行为序列集合中的、与该操作行为序列满足对应条件的预设操作行为序列,并将该操作行为序列中的、与该预设操作行为序列中的预设操作行为相同且满足预设条件的操作行为确定为目标操作行为,以得到目标操作行为序列;对于所确定的每一个目标操作行为序列,确定并存储与该目标操作行为序列中的每一个目标操作行为相关联的信息。该实施方式提高了信息存储的准确性。
-
公开(公告)号:CN107293296A
公开(公告)日:2017-10-24
申请号:CN201710508531.5
申请日:2017-06-28
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明实施例公开了一种语音识别结果纠正方法、装置、设备及存储介质。所述语音识别结果纠正方法包括:对获取的语音数据进行语音识别,得到初始文本信息;采用神经机器翻译NMT模型对所述初始文本信息进行识别纠正,得到最终的文本识别结果。本发明实施例通过采用神经机器翻译NMT模型对语音识别得到的初始文本信息,进行再次识别纠正,能够得到较为准确的文本识别结果,可以提高语音识别的准确率。
-
公开(公告)号:CN109145148A
公开(公告)日:2019-01-04
申请号:CN201710506048.3
申请日:2017-06-28
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/68 , G06F16/632 , G10L15/02 , G10L15/08
Abstract: 本申请公开了信息处理方法和装置。该方法的一具体实施方式包括:获取待识别的音频文件并从音频文件中提取至少一段音频;从至少一段音频中提取至少一个声纹特征向量;将至少一个声纹特征向量进行聚类生成至少一个中心声纹特征向量;对于每个中心声纹特征向量,将该中心声纹特征向量与预定的声纹库进行匹配,并按照匹配度由高到低的顺序选取第一预定数目个声源信息并输出,其中,声纹库用于表征声纹特征向量和声源信息的对应关系。该实施方式能够提高识别音频文件中各声源的声源信息的速度和准确性。
-
公开(公告)号:CN107240396A
公开(公告)日:2017-10-10
申请号:CN201710457375.4
申请日:2017-06-16
Applicant: 百度在线网络技术(北京)有限公司
CPC classification number: G10L15/07 , G10L15/063 , G10L2015/0631
Abstract: 本发明实施例公开了一种说话人自适应方法、装置、设备及存储介质。所述说话人自适应方法包括:获取目标说话人的第一语音数据;将所述第一语音数据输入预先训练得到的批规范化BN网络中进行自适应训练,得到包含所述目标说话人语音参数的语音识别模型。本发明实施例通过将目标说话人的第一语音数据输入预先训练得到的批规范化BN网络中进行自适应训练,得到包含所述目标说话人语音参数的语音识别模型,可以简化说话人自适应过程,降低自适应复杂度,提高自适应性能。
-
公开(公告)号:CN303266248S
公开(公告)日:2015-07-01
申请号:CN201530019392.1
申请日:2015-01-22
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 1.本外观设计产品的名称:带图形用户界面的手机;2.本外观设计产品的用途:本外观设计产品用于运行程序及通信;3.本外观设计产品的设计要点:在于屏幕中的图像用户界面的界面内容;4.最能表明本外观设计设计要点的图片或照片:设计1主视图;5.指定基本设计: 设计1。6.界面用途:设计1主视图显示发起者创建“小金库”的初始界面;设计2主视图显示正在创建“小金库”的界面;设计3主视图显示参与者付款到“小金库”的界面;设计4主视图显示发起者从“小金库”中提现的界面;设计5主视图显示参与者查看“小金库”的收支明细的界面;设计6主视图显示用户查看发起和参与的“小金库”列表的界面。
-
-
-
-
-
-
-