一种说话人确认方法及装置

    公开(公告)号:CN107146624B

    公开(公告)日:2019-11-22

    申请号:CN201710214666.0

    申请日:2017-04-01

    Applicant: 清华大学

    Inventor: 李蓝天 王东

    Abstract: 本发明提供一种说话人确认方法及装置,包括:获取第二语音;将预先获取的第一语音和所述第二语音转换成对应的第一声谱图和第二声谱图;使用卷积神经网络对所述第一声谱图和所述第二声谱图进行特征提取,获取对应的第一特征和第二特征;使用时延神经网络对所述第一特征和所述第二特征进行特征提取,获取对应的第三特征和第四特征;根据所述第三特征和所述第四特征对说话人进行确认。本发明通过将卷积神经网络和时延神经网络相结合,对所述第一语音和所述第二语音进行两次特征提取,将最终提取的第三特征和第四特征进行比较,从而实现对说话人的确认,本发明计算简单,鲁棒性强,能达到很好的识别效果。

    维语语音识别方法和装置
    22.
    发明授权

    公开(公告)号:CN105336323B

    公开(公告)日:2018-12-28

    申请号:CN201510662027.1

    申请日:2015-10-14

    Applicant: 清华大学

    Abstract: 本申请提供了一种维语语音识别的方法和装置,包括:将维语语音帧对应的声学特征作为自适应声学模型中的汉语声学模型的参数输入,经过线性变换和非线性变换将所述汉语声学模型下的维语语音帧对应的声学特征变换到汉语声学模型的高维非线性特征空间分布;将所述维语语音帧对应的汉语声学模型的高维非线性特征空间分布作为自适应声学模型中的维语声学模型的参数输入到所述维语声学模型中,训练所述维语声学模型,获得重构的自适应声学模型;使用遗传算法或者穷举算法筛选所述重构的自适应声学模型,获得最优自适应声学模型;使用所述最优自适应声学模型进行维语语音的识别,从而解决了维语语料不足和语音识别准确率低的问题。

    一种数字货币交易方法和装置

    公开(公告)号:CN108805538A

    公开(公告)日:2018-11-13

    申请号:CN201810612667.5

    申请日:2018-06-14

    Inventor: 汤志远 王东

    CPC classification number: G06Q20/065 G06Q20/3829 G06Q20/40145

    Abstract: 本发明实施例提供一种数字货币交易方法和装置,其中,所述方法包括:根据任一数字货币持有人的生物特征信息,生成该数字货币持有人的私钥和公钥;根据该数字货币持有人的私钥和公钥进行数字货币交易。本发明实施例提供的一种数字货币交易方法和装置,将基于生物特征信息生成的私钥和公钥应用于数字货币交易,生物特征信息的唯一性使得数字货币交易对媒介的依赖性大大减小,即数字货币持有人不需携带密钥,可随时通过生物特征信息生成;此外,实现了个人身份信息与数字货币的绑定,使得个人的货币行为与个人信誉相联系,有助于促进数字货币市场的健康和稳定。

    一种基于声纹图形标识的身份认证方法及装置

    公开(公告)号:CN108766442A

    公开(公告)日:2018-11-06

    申请号:CN201810622367.5

    申请日:2018-06-15

    Inventor: 王东 李蓝天 石颖

    Abstract: 本发明实施例提供一种基于声纹图形标识的身份认证方法及装置。所述方法包括接收用户终端发送的业务请求,至少包括认证语音和用户标识;根据认证语音得到认证声纹信息,并与对应的预留声纹信息进行比对以得到置信度;若置信度大于置信阈值,则生成对应的图形标识并发送给用户终端,同时设置认证时间范围;若在认证时间范围内接收到用户终端发送的身份认证信息则判定认证成功,所述身份认证信息包括图形标识,本发明实施例通过认证服务器接收用户终端发送的包含有认证语音的业务请求来验证认证语音是否认证成功,若成功,则生成对应的图形标识,并发送给用户终端,从而使用户能够在预设的认证时间范围内通过用户终端的图形标识安全、可靠得实现身份认证。

    声纹谱提取方法及装置
    25.
    发明公开

    公开(公告)号:CN107274890A

    公开(公告)日:2017-10-20

    申请号:CN201710538107.5

    申请日:2017-07-04

    Inventor: 王东 李蓝天

    Abstract: 本发明提供一种声纹谱提取方法及装置,其中,方法包括:获取样本语音信号并转换成log域频谱;基于log域频谱,利用预先训练的声纹因子提取模型提取每一帧样本语音信号的声纹因子,利用预先训练的内容因子提取模型提取每一帧样本语音信号的内容因子;基于所提取的内容因子和声纹因子,训练得到用于将内容因子重构成内容谱的内容谱重构模型和用于将声纹因子重构成声纹谱的声纹谱重构模型;将所述内容谱重构模型丢弃,将目标语音信号输入声纹谱重构模型,获得目标语音信号中的声纹谱。本发明能实现从语音信号中精确的提取声纹谱,进而使后续可以根据所提取的声纹谱清晰观察到说话人特性,以帮助提高司法鉴定及身份识别等领域中声纹验证的准确度。

    一种语音识别的方法和装置

    公开(公告)号:CN106847266A

    公开(公告)日:2017-06-13

    申请号:CN201611219528.3

    申请日:2016-12-26

    Applicant: 清华大学

    Abstract: 本申请提供了一种语音识别的方法和装置,包括:将语言模型表示为有限状态转移机;待识别的新词根据设定规则在所述有限状态转移机获得所述新词对应的近义词;将所述新词添加到所述有限状态转移机,获得更新后的有限状态转移机,使用所述更新后的有限状态转移机进行语音识别,从而解决了目前语音识别中新词快速添加和识别的问题。

    股票风险预测方法和装置
    28.
    发明公开

    公开(公告)号:CN105787582A

    公开(公告)日:2016-07-20

    申请号:CN201510993312.1

    申请日:2015-12-24

    Applicant: 清华大学

    Inventor: 于洋 王东 刘荣

    CPC classification number: G06Q10/04 G06Q40/04 G06Q40/08

    Abstract: 本申请提供了一种股票风险预测方法和装置,包括:获取本地设备端所需调用的股市字段;基于长短期记忆循环神经网络的隐藏层对所述股市字段进行预测,获取股票的预测结果,其中,所述预测结果包括下一交易日股市的波动率的预测值,所述长短期记忆循环神经网络还包括输入层和输出层;所述预测结果大于设定阈值,则股票存在风险,从而解决了现有技术中利用ARCH模型或GARCH模型进行股票预测不准确,进而存在较高风险的问题。

    维语语音识别方法和装置
    29.
    发明公开

    公开(公告)号:CN105336323A

    公开(公告)日:2016-02-17

    申请号:CN201510662027.1

    申请日:2015-10-14

    Applicant: 清华大学

    CPC classification number: G10L15/005 G10L15/063 G10L15/065 G10L25/39

    Abstract: 本申请提供了一种维语语音识别的方法和装置,包括:将维语语音帧对应的声学特征作为自适应声学模型中的汉语声学模型的参数输入,经过线性变换和非线性变换将所述汉语声学模型下的维语语音帧对应的声学特征变换到汉语声学模型的高维非线性特征空间分布;将所述维语语音帧对应的汉语声学模型的高维非线性特征空间分布作为自适应声学模型中的维语声学模型的参数输入到所述维语声学模型中,训练所述维语声学模型,获得重构的自适应声学模型;使用遗传算法或者穷举算法筛选所述重构的自适应声学模型,获得最优自适应声学模型;使用所述最优自适应声学模型进行维语语音的识别,从而解决了维语语料不足和语音识别准确率低的问题。

    一种流式细胞分析装置及分析方法

    公开(公告)号:CN104280328A

    公开(公告)日:2015-01-14

    申请号:CN201410280220.4

    申请日:2014-06-20

    Abstract: 本发明公开了一种流式细胞分析装置和分析方法,分析装置包括:上样检测装置,所述上样检测装置包括用于容置样本液且通过密封件进行密封的样本容器、一端与所述样本容器相连接的上样管路、设置于所述上样管路上的流量检测计以及与所述上样管路的另一端相连接的流动室;鞘液装置,所述鞘液装置包括鞘液容器、一端与所述鞘液容器相连接的鞘液管路以及设置于所述鞘液管路上的第一阀门装置;压力供给装置,所述压力供给装置包括气源、连接于所述气源和所述样本容器之间的第一气压管路和连接于所述气源和所述鞘液容器之间的第二气压管路。本发明提供的流式细胞分析装置,在保证成本较低和使用方便的基础上,解决了分析准确性较低的问题。

Patent Agency Ranking