-
公开(公告)号:CN105260355A
公开(公告)日:2016-01-20
申请号:CN201510604736.4
申请日:2015-09-21
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明提出一种分词方法和装置,该分词方法包括:根据已有的词条建立初始的分词词典;获取第一词条集合,在所述第一词条集合中选择满足预设条件的词条,以及,获取分词词典,采用获取的分词词典对所述满足预设条件的词条进行分词,并用分词后的词条更新获取的分词词典,其中,初始的第一词条集合由已有的词条组成,以及,初始获取的分词词典是所述初始的分词词典;采用更新后的分词词典对所述第一词条集合中的词条进行分词,根据分词后的词条获取第二词条集合;在确定满足收敛条件时,根据所述第二词条集合获取分词结果。该方法能够提高分词效果。
-
公开(公告)号:CN105489222B
公开(公告)日:2018-03-09
申请号:CN201510920588.7
申请日:2015-12-11
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明提出一种语音识别方法和装置,该语音识别方法包括:获取待识别的语音信号的特征;根据所述特征在构图生成的搜索空间内进行路径搜索,输出解码结果;根据所述解码结果判断是否需要拒识;如果需要拒识,则确定语音识别结果是拒识,如果不需要拒识,则根据所述解码结果获取语音识别结果。该方法具有很好的拒识效果。
-
公开(公告)号:CN105096944B
公开(公告)日:2017-11-03
申请号:CN201510427908.5
申请日:2015-07-20
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L15/183 , G10L15/26
CPC classification number: G06F17/30 , G10L15/183 , G10L15/26
Abstract: 本发明公开了一种语音识别方法及装置,其中所述方法包括:根据语音信息识别得到发音信息;根据所述查分树信息加载语言模型查分树,查询所述语言模型查分树确定与所述发音信息匹配的文字识别结果的概率得分;其中,所述查分树信息包括与文字对应的多个节点,每个节点至少包括当前节点与子节点之间的存储位置偏移量;根据所述概率得分选择文字识别结果,作为最终的识别结果。本发明实施例通过在启动时直接根据当前节点与子节点之间的存储位置偏移量加载语言模型查分树,这样大大的缩短了启动时间。
-
公开(公告)号:CN105096939B
公开(公告)日:2017-07-25
申请号:CN201510399209.4
申请日:2015-07-08
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明公开了一种语音唤醒方法和装置,其中,语音唤醒方法包括:S1、获取唤醒词,并根据唤醒词生成符合预设条件的垃圾词,以及根据唤醒词和垃圾词构建识别网络;S2、获取用户输入的语音信息,将语音信息切分为多个语音帧,并提取每个语音帧中的声学特征;S3、基于卷积神经网络声学模型对多个声学特征依次进行似然计算,以获得每个声学特征的声学特征得分;S4、根据声学特征得分从识别网络中选取最优识别路径,以及将最优识别路径对应的语音结果作为识别结果;以及S5、根据识别结果计算识别结果对应的置信度,并根据置信度获得唤醒结果并输出。本发明实施例的语音唤醒方法和装置,计算量小,功耗低,能够降低语音唤醒的误报率,提升用户使用体验。
-
公开(公告)号:CN105118502A
公开(公告)日:2015-12-02
申请号:CN201510413643.3
申请日:2015-07-14
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L15/04 , G10L15/02 , G10L15/16 , G10L21/0208
Abstract: 本发明提出一种语音识别系统的端点检测方法及系统,其中,该方法包括:基于长短时记忆神经网络训练声学识别模型;通过预设语音端点检测算法初步识别出待识别语音信号的语音端点;分帧提取待识别语音信号的语音特征信息,并将语音特征信息输入声学识别模型,以使声学识别模型根据语音特征信息生成待识别语音信号的声学识别结果;以及根据声学识别结果对初步识别出的语音端点进行调整。本发明实施例的语音识别系统的端点检测方法,提供了一种通过声学识别结果对初步识别出的语音端点进行调整的端点检测方式,准确定位了待识别语音信号的语音端点,提高了语音端点检测的准确率,进而可提高语音识别的准确性,提高语音识别系统的性能。
-
公开(公告)号:CN105096944A
公开(公告)日:2015-11-25
申请号:CN201510427908.5
申请日:2015-07-20
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L15/183 , G10L15/26
CPC classification number: G06F17/30 , G10L15/183 , G10L15/26
Abstract: 本发明公开了一种语音识别方法及装置,其中所述方法包括:根据语音信息识别得到发音信息;根据所述查分树信息加载语言模型查分树,查询所述语言模型查分树确定与所述发音信息匹配的文字识别结果的概率得分;其中,所述查分树信息包括与文字对应的多个节点,每个节点至少包括当前节点与子节点之间的存储位置偏移量;根据所述概率得分选择文字识别结果,作为最终的识别结果。本发明实施例通过在启动时直接根据当前节点与子节点之间的存储位置偏移量加载语言模型查分树,这样大大的缩短了启动时间。
-
公开(公告)号:CN103971681A
公开(公告)日:2014-08-06
申请号:CN201410168436.1
申请日:2014-04-24
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明实施例提供了一种语音识别方法,包括:采集第一音频数据;利用第一模型和第二模型,对所述第一音频数据进行语音识别,以获得语音识别结果;其中,所述第一模型用于识别所述第一音频数据中所包含的客户端所播放的第二音频数据,所述第二模型用于识别所述第一音频数据中所包含的除了所述客户端所播放的第二音频数据之外的第三音频数据;本发明实施例还提供一种语音识别系统。根据本发明实施例提供的技术方案,可以实现提高语音识别系统中语音唤醒的成功率。
-
公开(公告)号:CN105096939A
公开(公告)日:2015-11-25
申请号:CN201510399209.4
申请日:2015-07-08
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明公开了一种语音唤醒方法和装置,其中,语音唤醒方法包括:S1、获取唤醒词,并根据唤醒词生成符合预设条件的垃圾词,以及根据唤醒词和垃圾词构建识别网络;S2、获取用户输入的语音信息,将语音信息切分为多个语音帧,并提取每个语音帧中的声学特征;S3、基于卷积神经网络声学模型对多个声学特征依次进行似然计算,以获得每个声学特征的声学特征得分;S4、根据声学特征得分从识别网络中选取最优识别路径,以及将最优识别路径对应的语音结果作为识别结果;以及S5、根据识别结果计算识别结果对应的置信度,并根据置信度获得唤醒结果并输出。本发明实施例的语音唤醒方法和装置,计算量小,功耗低,能够降低语音唤醒的误报率,提升用户使用体验。
-
公开(公告)号:CN105187656B
公开(公告)日:2018-09-07
申请号:CN201510613491.1
申请日:2015-09-23
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明公开了一种通讯录联系人匹配方法和装置,其中,通讯录联系人匹配方法包括:获取用户发送的语音信息,并将语音信息识别为文本信息;将文本信息转换为第一音子序列,并根据第一音子序列生成第一状态序列;获取通讯录中的多个联系人信息;分别将多个联系人信息转换为对应的第二音子序列,并根据第二音子序列生成第二状态序列;计算第一状态序列与多个第二状态序列的相似度,并根据相似度对多个第二状态序列进行排序,以及将排名前N名的第二状态序列对应的联系人信息反馈给用户。本发明实施例的通讯录联系人匹配方法和装置,提高了用户语音搜索联系人姓名的准确率。
-
公开(公告)号:CN105161096B
公开(公告)日:2017-05-10
申请号:CN201510609522.6
申请日:2015-09-22
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L15/14 , G10L15/187
Abstract: 本申请提出一种基于垃圾模型的语音识别处理方法和装置,其中,该方法包括:获取待处理的音节列表中与每个音节对应的三音子模型;采用预先训练的隐马尔可夫模型,根据所述三音子模型获取与每个音节对应的三音子状态序列;根据与每个音节对应的三音子状态序列,从所述音节列表中筛选出多个建模音节,其中,所述多个建模音节的数量与预先设置的垃圾模型数目相同;应用所述多个建模音节生成对应数量的多个垃圾模型。实现了建立与应用需要匹配数量的、基于音节聚类的垃圾模型,从而提高了建模组网的效率和灵活性,以及提高了语音识别处理的准确性。
-
-
-
-
-
-
-
-
-