-
公开(公告)号:CN113823294B
公开(公告)日:2022-03-11
申请号:CN202111390613.7
申请日:2021-11-23
申请人: 清华大学 , 上海浦东发展银行股份有限公司
IPC分类号: G10L17/04
摘要: 本发明提供一种跨信道声纹识别方法、装置、设备和存储介质,包括:获取待识别声纹音频数据,其中,所述待识别声纹音频数据采集于设定信道集合中的信道,所述设定信道集合包括至少两种不同信道;将所述待识别声纹音频数据输入预置的跨信道声纹识别模型,得到声纹音频数据处理结果,以根据所述声纹音频数据处理结果进行声纹音频数据识别;其中,所述跨信道声纹识别模型采用所述设定信道集合中采集的声纹音频数据经过多次迭代过程训练得到,在每一次迭代过程中采用两种不同信道中采集的声纹音频数据进行模型参数训练。本发明的技术方案可以提高跨信道声纹识别的识别准确性。
-
公开(公告)号:CN113823294A
公开(公告)日:2021-12-21
申请号:CN202111390613.7
申请日:2021-11-23
申请人: 清华大学 , 上海浦东发展银行股份有限公司
IPC分类号: G10L17/04
摘要: 本发明提供一种跨信道声纹识别方法、装置、设备和存储介质,包括:获取待识别声纹音频数据,其中,所述待识别声纹音频数据采集于设定信道集合中的信道,所述设定信道集合包括至少两种不同信道;将所述待识别声纹音频数据输入预置的跨信道声纹识别模型,得到声纹音频数据处理结果,以根据所述声纹音频数据处理结果进行声纹音频数据识别;其中,所述跨信道声纹识别模型采用所述设定信道集合中采集的声纹音频数据经过多次迭代过程训练得到,在每一次迭代过程中采用两种不同信道中采集的声纹音频数据进行模型参数训练。本发明的技术方案可以提高跨信道声纹识别的识别准确性。
-
公开(公告)号:CN112487384A
公开(公告)日:2021-03-12
申请号:CN202011341050.8
申请日:2020-11-25
摘要: 本申请涉及人工智能领域,提供了一种身份验证的方法。所述方法包括:获得在注册场景下从第一注册对象提取的生物特征;获得在识别场景下从第一识别对象提取的生物特征;根据第一注册对象的生物特征述第一识别对象的生物特征计算似然打分;以及根据似然打分判断第一识别对象的身份是否与第一注册对象的身份一致。似然打分包括后验概率部分和边缘概率部分。
-
公开(公告)号:CN108766442B
公开(公告)日:2020-11-06
申请号:CN201810622367.5
申请日:2018-06-15
申请人: 清华大学 , 北京孚睿星辰智能科技有限责任公司
摘要: 本发明实施例提供一种基于声纹图形标识的身份认证方法及装置。所述方法包括接收用户终端发送的业务请求,至少包括认证语音和用户标识;根据认证语音得到认证声纹信息,并与对应的预留声纹信息进行比对以得到置信度;若置信度大于置信阈值,则生成对应的图形标识并发送给用户终端,同时设置认证时间范围;若在认证时间范围内接收到用户终端发送的身份认证信息则判定认证成功,所述身份认证信息包括图形标识,本发明实施例通过认证服务器接收用户终端发送的包含有认证语音的业务请求来验证认证语音是否认证成功,若成功,则生成对应的图形标识,并发送给用户终端,从而使用户能够在预设的认证时间范围内通过用户终端的图形标识安全、可靠得实现身份认证。
-
公开(公告)号:CN111563262A
公开(公告)日:2020-08-21
申请号:CN202010296911.9
申请日:2020-04-15
申请人: 清华大学 , 北京孚睿星辰智能科技有限责任公司
摘要: 本发明实施例提供一种基于可逆深度神经网络的加密方法及系统。该方法包括:获取待加密数据;将待加密数据输入至加密器中进行正向计算,得到加密结果;其中加密器是基于任意样本数据和任意目标函数,通过控制所述任意目标函数来控制加密后数据的展现形式,并对采用可逆计算单元构建得到的神经网络模型进行训练所得到的。本发明实施例通过采用不同的可逆算子进行任意数目和顺序的组合得到可逆深度神经网络,并采用不同的随机方法进行参数初始化,使用任意训练样本和任意目标函数进行模型训练得到加密器,设计简单,且能实现无损解密,并控制加密数据展现形式,使得计算效率显著提高。
-
公开(公告)号:CN107481713B
公开(公告)日:2020-06-02
申请号:CN201710582572.9
申请日:2017-07-17
申请人: 清华大学 , 北京孚睿星辰智能科技有限责任公司
摘要: 本发明公开一种混合语言语音合成方法及装置。其中,所述方法包括:获取待合成文本,并提取所述待合成文本的语言学特征向量;获取特定说话人的语音数据,并根据所述特定说话人的语音数据提取所述特定说话人的说话人向量;将所述待合成文本的语言学特征向量和所述特定说话人的说话人向量进行拼接,获得所述待合成文本的语音合成输入向量;根据所述待合成文本的语音合成输入向量和预先建立的混合语言语音合成模型,获得所述待合成文本的特定说话人的合成语音。所述装置用于执行上述方法。本发明提供的混合语言语音合成方法及装置,能够实现语音合成说话人的快速更改与混合语言语音合成,提高混合语言语音合成的效率。
-
公开(公告)号:CN107274890B
公开(公告)日:2020-06-02
申请号:CN201710538107.5
申请日:2017-07-04
申请人: 清华大学 , 北京孚睿星辰智能科技有限责任公司
摘要: 本发明提供一种声纹谱提取方法及装置,其中,方法包括:获取样本语音信号并转换成log域频谱;基于log域频谱,利用预先训练的声纹因子提取模型提取每一帧样本语音信号的声纹因子,利用预先训练的内容因子提取模型提取每一帧样本语音信号的内容因子;基于所提取的内容因子和声纹因子,训练得到用于将内容因子重构成内容谱的内容谱重构模型和用于将声纹因子重构成声纹谱的声纹谱重构模型;将所述内容谱重构模型丢弃,将目标语音信号输入声纹谱重构模型,获得目标语音信号中的声纹谱。本发明能实现从语音信号中精确的提取声纹谱,进而使后续可以根据所提取的声纹谱清晰观察到说话人特性,以帮助提高司法鉴定及身份识别等领域中声纹验证的准确度。
-
公开(公告)号:CN109524017A
公开(公告)日:2019-03-26
申请号:CN201811424175.X
申请日:2018-11-27
申请人: 北京分音塔科技有限公司 , 清华大学
摘要: 本发明涉及一种用户自定义词的语音识别增强方法和装置,所述方法包括:获取用户自定义词;将用户自定义词拆分为已有词语的组合;将用户自定义词拆分后的已有词语组合生成用户自定义词典FST图;将用户自定义词典FST图和原有的解码图进行合并处理,得到合并后的解码图;利用合并后的解码图对用户输入的语音进行语音识别处理。本发明所述方法通过将用户自定义词FST图和原有的HCLG解码图合并,完成了对用户自定义词的权重增强,从而提高了对用户自定义词的识别效果;并且本方法充分利用了语音识别中解码图的信息,并在语音识别过程中充分结合了声学模型和语言模型的信息进行路径搜索,从而增强了对用户自定义词的识别准确率。
-
公开(公告)号:CN108766415A
公开(公告)日:2018-11-06
申请号:CN201810496872.X
申请日:2018-05-22
申请人: 清华大学 , 北京孚睿星辰智能科技有限责任公司
摘要: 本发明实施例提供一种语音测评方法,包括:根据每一音素在待测评语音中的发音长度、音高特征和后验概率,以及所述每一音素在待测评语音对应的参考语音中的发音长度、音高特征和后验概率,对所述待测评语音进行语音测评。本发明实施例提供的一种语音测评方法,以参考语音为衡量标准,从发音长度、音高特征和后验概率三方面对待测评语音进行语音测评,能够全方位地体现发言人的口语水平,以使得发言人能够从不同角度了解自身口语的不足,从而实现口语水平的提高。
-
公开(公告)号:CN108530566A
公开(公告)日:2018-09-14
申请号:CN201810383117.0
申请日:2018-04-26
摘要: 本发明公开了一种水溶性偕胺肟化聚丙烯腈溶液及其制备方法,包括以下步骤:将聚丙烯腈在有机溶剂中偕胺肟化改性处理后得到偕胺肟化聚丙烯腈有机溶液;把一定浓度的偕胺肟化聚丙烯腈有机溶液与一定浓度的强碱水溶液在加热搅拌条件下溶解,即可把原本水不溶性的偕胺肟化聚丙烯腈转化为水溶性的偕胺肟化聚丙烯腈,得到的均相混合溶液可以用水以任意比例稀释至所需浓度。采用本发明所提供的一种偕胺肟聚丙烯腈水溶性改性方法,条件温和、过程简便,所得到的水溶性偕胺肟聚丙烯腈可以非常方便地与水凝胶等亲水性或水溶性物质在水溶液中共混合制备相应的复合材料。该发明极大地拓展了偕胺肟聚丙烯腈的合成和加工方法以及应用范围。
-
-
-
-
-
-
-
-
-