一种基于空时残差神经网络的远场语音识别方法

    公开(公告)号:CN110895933B

    公开(公告)日:2022-05-03

    申请号:CN201811030952.2

    申请日:2018-09-05

    Abstract: 本发明公开了一种基于空时残差神经网络的远场语音识别方法,所述方法包括:步骤1)构建并训练空时残差神经网络ST‑RES‑LSTM,该神经网络是在的空间和时间两个维度上都引入了残差结构的LSTM神经网络;步骤2)利用训练好的空时残差神经网络ST‑RES‑LSTM进行声学模型训练,并生成每一帧的分类概率;步骤3)构建语音识别解码网络,并使用步骤2)的训练好的声学模型进行维特比解码出最终识别结果。本发明的方法在LSTM网络的空间和时间两个维度都引入残差结构,既能缓解层数加深带来的梯度消失问题,又能缓解LSTM在时间维度存在的梯度消失问题,从而提高语音识别的性能。

    一种自然语言文本的惯用句式提取方法及电子装置

    公开(公告)号:CN113779961A

    公开(公告)日:2021-12-10

    申请号:CN202010518026.0

    申请日:2020-06-09

    Abstract: 本发明提供一种自然语言文本的惯用句式提取方法及电子装置,包括:对采集到的每一语句进行分词、词性标注及依存句法分析;将各语句转换为若干单句,并依据词性标注结果与依存句法分析结果,对各单句主干进行抽取,将各单句表示为词汇和词性标签的列表;将各单句的列表进行合并,得到各语句的惯用句式。本发明提出一种不损失句式信息的长难句化简方法,针对句式提取的需要对中文长难句中非句子主干部分进行处理,提高句式提取准确度,本发明还提出一种句式信息表示结构,使用词汇、词汇候选集、词性标签来表示句式信息,保留尽可能多的句式信息。

    一种声纹识别方法、装置、设备及存储介质

    公开(公告)号:CN112435672A

    公开(公告)日:2021-03-02

    申请号:CN202011105330.9

    申请日:2020-10-15

    Abstract: 本发明公开了一种声纹识别方法、装置、设备及存储介质,该方法包括:获取用户的包含登录指令待识别的音频数据,输入声纹提取模型,输出声学特征;将所述声学特征输入已训练的声纹识别模型,输出识别文本;根据预先存储的验证音频数据对所述识别文本进行识别,以识别用户身份;响应于所述用户身份识别成功,执行所述登录执行。本发明针对如何解决由于传统声纹识别算法的局限性,通过获取用户的包含登录指令待识别的音频数据,输入声纹提取模型,输出声学特征;将所述声学特征输入已训练的声纹识别模型,输出识别文本;根据预先存储的验证音频数据对所述识别文本进行识别,以识别用户身份,提高音频数据进行登录验证的准确率。

Patent Agency Ranking