一种低资源嵌入式语音识别的拒识方法

    公开(公告)号:CN105321518B

    公开(公告)日:2018-12-04

    申请号:CN201410387404.0

    申请日:2014-08-05

    Abstract: 本发明涉及一种低资源嵌入式语音识别的拒识方法,该方法包括:基于命令词表和垃圾音素列表,分别构建命令词解码网络和垃圾音素解码网络,将垃圾音素解码网络并联到命令词解码网络中,形成完整的解码网路空间;生成语音背景概率得分表。将待识别语音输入解码网络空间进行第一次识别:解码识别,对第一次识别结果中的垃圾因素拒识,再对第一次识别结果中的命令词进行第二次判别:置信度判别,得到最终识别结果。本方法可提高对集外词的拒识率,节省内存占用,满足了低资源条件嵌入式语音识别的应用需求。

    一种神经网络声学模型激活函数定点量化方法

    公开(公告)号:CN107292382A

    公开(公告)日:2017-10-24

    申请号:CN201610191900.8

    申请日:2016-03-30

    CPC classification number: G06N3/04 G06N3/08 G10L15/16

    Abstract: 本发明提供一种神经网络声学模型激活函数定点量化方法,该方法具体包括:步骤(1)在DNN模型的第l层,将所述第l-1层的浮点激活向量中x(l-1)=[x1,…,xN]T的每个浮点激活值线性地量化为0~2K的整数,得到所述第l-1层的线性定点量化的激活向量x*(l-1);步骤(2)对步骤(1)中得到的所述第l-1层的线性定点量化的激活向量x*(l-1)中的每个激活值进一步分级,即将所述每个激活值近似为最为邻近的2的整次幂,最终得到所述第l-1层的分级定点量化激活向量x**(l-1);步骤(3)对第l层进行线性定点量化,即将该层浮点型权值矩阵W(l)的权值wM,N线性地量化为-127到127间的整数;步骤(4)进行DNN第l层的前馈计算,最终得到第l层的浮点型激活向量x(l)。

    一种基于字和词混合语言模型的汉语语音关键词检索方法

    公开(公告)号:CN106294460A

    公开(公告)日:2017-01-04

    申请号:CN201510291079.2

    申请日:2015-05-29

    Abstract: 本发明提出了一种基于字和词混合语言模型的关键词检索方法及系统,所述方法包含:步骤101),根据词性区分训练语料中非常见词和常见词,为组成非常见词的各个字添加标识信息,将原训练语料划分为由常见词和标识非常见词信息的符号构成的新语料;根据新语料构建词的语言模型并根据原训练语料按单字重新训练一个语言模型进而得到字的语言模型;步骤102)构建主解码网络和子解码网络,基于主解码网络和子解码网络进行关键词检索;其中,当进行解码时由所述词的语言模型决定是否进入带有标识非常见词信息的节点,且带有标识非常见词信息的节点连接一个由全部单字构成的子解码网络,当进入子解码网络后由所述字的语言模型限制搜索范围。

    一种低资源嵌入式语音识别的拒识方法

    公开(公告)号:CN105321518A

    公开(公告)日:2016-02-10

    申请号:CN201410387404.0

    申请日:2014-08-05

    Abstract: 本发明涉及一种低资源嵌入式语音识别的拒识方法,该方法包括:基于命令词表和垃圾音素列表,分别构建命令词解码网络和垃圾音素解码网络,将垃圾音素解码网络并联到命令词解码网络中,形成完整的解码网路空间;生成语音背景概率得分表。将待识别语音输入解码网络空间进行第一次识别:解码识别,对第一次识别结果中的垃圾因素拒识,再对第一次识别结果中的命令词进行第二次判别:置信度判别,得到最终识别结果。本方法可提高对集外词的拒识率,节省内存占用,满足了低资源条件嵌入式语音识别的应用需求。

Patent Agency Ranking