-
公开(公告)号:CN109346109B
公开(公告)日:2020-02-07
申请号:CN201811482074.8
申请日:2018-12-05
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请实施例公开了基频提取方法和装置。该方法的一具体实施方式包括:基于待处理语音信号的声学特征,提取待处理语音信号中各语音帧的候选基频点;对语音帧进行清浊音分类,得到各语音帧对应的清浊音类别;基于各语音帧对应的清浊音类别以及预设的基频筛选条件对候选基频点进行修正,并采用动态规划算法从修正后的候选基频点中确定出待处理语音信号的基频序列。该实施方式提升了基频提取的准确性。
-
公开(公告)号:CN105656887A
公开(公告)日:2016-06-08
申请号:CN201511020415.6
申请日:2015-12-30
Applicant: 百度在线网络技术(北京)有限公司
IPC: H04L29/06
CPC classification number: G10L17/22 , G06F16/686 , G06N5/022 , G06N7/005 , G06N20/10 , G06N20/20 , G10L17/04 , G10L17/06 , G10L17/24 , H04L63/0861 , G10L17/00 , H04L63/0807 , H04L63/0815 , H04L63/083 , H04L65/1073
Abstract: 本发明公开了一种基于人工智能的声纹认证方法以及装置,其中,该方法包括:接收用户的注册请求,并将注册字符串提供至用户;接收用户阅读注册字符串的语音信息,并根据语音信息生成N段语音,其中,N为正整数;根据性别分类模型和N段语音确定用户的性别标签;以及根据性别标签和N段语音生成用户的注册声纹模型。实现了在注册的过程中,通过先获取该用户的性别标签,之后根据该性别标签使用不同的模型以生成对应的注册声纹模型,使得在登录时提高了声纹密码作为认证手段的可用性,提高了声纹匹配的性能,并使得用户通过语音即可完成注册,简化了用户的操作步骤。
-
公开(公告)号:CN105336324B
公开(公告)日:2018-04-03
申请号:CN201510792176.X
申请日:2015-11-17
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明实施例提供了一种语种识别方法及装置。一方面,本发明实施例通过接收到语音信号包含的第N个语音片段之后,根据已经接收到的前N个语音片段,进行语种识别,以获得至少一个语种中每个语种的得分,N的取值为2、3、4、……;从而,若存在得分达到指定阈值的语种,将得分达到指定阈值的语种作为与所述语音信号相匹配的语种。因此,本发明实施例提供的技术方案解决了现有技术中语种识别的效率比较低,使语种识别无法应用于需要快速获得识别结果的应用场景中的问题。
-
公开(公告)号:CN104717219B
公开(公告)日:2017-03-15
申请号:CN201510125684.2
申请日:2015-03-20
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明公开了一种基于人工智能的声纹登录方法和装置,其中,方法包括:S1、接收用户的登录请求;S2、根据登录请求生成伪随机登录字符串;S3、将伪随机登录字符串提供至用户,并接收用户阅读伪随机登录字符串的语音信息;以及S4、根据语音信息对用户进行登录验证。本发明实施例的基于人工智能的声纹登录方法和装置,通过接收用户的登录请求,根据登录请求生成伪随机登录字符串,将伪随机登录字符串提供至用户,并接收用户阅读伪随机登录字符串的语音信息,以及根据语音信息对用户进行登录验证,有效地提高了声纹登录的成功率,提高了性能,且提高了声纹登录的可用性,多样性保证了不会被录音欺骗,从而提高了声纹登录的安全性。
-
公开(公告)号:CN105336324A
公开(公告)日:2016-02-17
申请号:CN201510792176.X
申请日:2015-11-17
Applicant: 百度在线网络技术(北京)有限公司
CPC classification number: G10L15/00 , G10L15/02 , G10L15/005
Abstract: 本发明实施例提供了一种语种识别方法及装置。一方面,本发明实施例通过接收到语音信号包含的第N个语音片段之后,根据已经接收到的前N个语音片段,进行语种识别,以获得至少一个语种中每个语种的得分,N的取值为2、3、4、……;从而,若存在得分达到指定阈值的语种,将得分达到指定阈值的语种作为与所述语音信号相匹配的语种。因此,本发明实施例提供的技术方案解决了现有技术中语种识别的效率比较低,使语种识别无法应用于需要快速获得识别结果的应用场景中的问题。
-
公开(公告)号:CN104717219A
公开(公告)日:2015-06-17
申请号:CN201510125684.2
申请日:2015-03-20
Applicant: 百度在线网络技术(北京)有限公司
CPC classification number: H04L63/0861 , G10L17/00
Abstract: 本发明公开了一种基于人工智能的声纹登录方法和装置,其中,方法包括:S1、接收用户的登录请求;S2、根据登录请求生成伪随机登录字符串;S3、将伪随机登录字符串提供至用户,并接收用户阅读伪随机登录字符串的语音信息;以及S4、根据语音信息对用户进行登录验证。本发明实施例的基于人工智能的声纹登录方法和装置,通过接收用户的登录请求,根据登录请求生成伪随机登录字符串,将伪随机登录字符串提供至用户,并接收用户阅读伪随机登录字符串的语音信息,以及根据语音信息对用户进行登录验证,有效地提高了声纹登录的成功率,提高了性能,且提高了声纹登录的可用性,多样性保证了不会被录音欺骗,从而提高了声纹登录的安全性。
-
公开(公告)号:CN109346109A
公开(公告)日:2019-02-15
申请号:CN201811482074.8
申请日:2018-12-05
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请实施例公开了基频提取方法和装置。该方法的一具体实施方式包括:基于待处理语音信号的声学特征,提取待处理语音信号中各语音帧的候选基频点;对语音帧进行清浊音分类,得到各语音帧对应的清浊音类别;基于各语音帧对应的清浊音类别以及预设的基频筛选条件对候选基频点进行修正,并采用动态规划算法从修正后的候选基频点中确定出待处理语音信号的基频序列。该实施方式提升了基频提取的准确性。
-
-
-
-
-
-