一种音频关键词模板的筛选和优化方法

    公开(公告)号:CN106847259B

    公开(公告)日:2020-04-03

    申请号:CN201510882805.8

    申请日:2015-12-03

    Abstract: 本发明提供一种音频关键词模板的筛选和优化方法,所述方法包括:步骤1)对每个音频关键词模板样本进行特征提取,将所提取的特征通过一个深层神经网络,计算在一个给定音素集上全部音素的后验概率;步骤2)计算模板的后验概率稳定性分数、发音可靠性分数和邻域相似性分数;步骤3)计算每个音频关键词模板的上述三种分数的加权平均值,记为平均分数;步骤4)按照平均分数从大到小的顺序进行排序,选取前L个音频关键词模板作为代表性发音模板;步骤5)对每个代表性发音模板进行处理,调整其发音序列上每一帧的各发音单元的后验概率,并最小化模板的邻域相似性分数;生成优化的L个音频检索词模板。

    一种自由定制的中文预处理方法及其系统

    公开(公告)号:CN107577666B

    公开(公告)日:2019-11-19

    申请号:CN201710827271.8

    申请日:2017-09-14

    Abstract: 本发明涉及一种自由定制的中文预处理方法,包括:步骤1)从配置文件中读取参数列表并记录;步骤2)判断输入是否为一个文件夹;步骤3)经过处理后,生成分词后的结果和带词频的结果,分别保存在用户指定的seg文件夹、tf文件夹;生成一个全局词典,保存在outputdir文件夹下的df文件夹中;步骤4)根据df文件夹中的全局词典和dfTheshold阈值,生成全局停用词词典,将其保存在df文件夹中;判断每个文件或子文件中的每个词是否在停用词词典中,将滤除后的文件或子文件保存到remove_words文件夹中;步骤5)判断步骤2)的输入是否为单文件且多进程;当步骤2)输入为单个文件且多进程时,合并remove_words文件夹中的子文件成一个大文件,并将这些子文件删除;否则,程序结束。

    一种无监督单传声器语音降噪方法及系统

    公开(公告)号:CN108574911B

    公开(公告)日:2019-10-22

    申请号:CN201710137778.0

    申请日:2017-03-09

    Abstract: 本发明公开了一种无监督单传声器语音降噪方法,所述方法包括:步骤1)对采集的覆盖所有音素的语音训练数据的进行频谱提取,然后对幅度谱进行k均值聚类,得到每个类别对应的语音字典;然后将所有不同类别的语音字典组合成一个完备的语音字典WS;步骤2)对当前时刻到达的带噪信号进行短时傅里叶变换得到当前帧幅度谱xt,再和前L帧已经处理过的幅度谱结合作为输出语音谱X=[xt‑L,...,xt‑1,xt],将前一帧估计得到的噪声矩阵WN和语音字典WS结合为总的字典矩阵W=[WS WN],采用迭代的算法对输出语音谱X进行非负矩阵分解,得到噪声矩阵和当前帧对应的语音噪声权重向量步骤3)通过估计得到的噪声矩阵和噪声权重向量重构出降噪后的当前帧语音信号。

    一种基于字和词混合语言模型的汉语语音关键词检索方法

    公开(公告)号:CN106294460B

    公开(公告)日:2019-10-22

    申请号:CN201510291079.2

    申请日:2015-05-29

    Abstract: 本发明提出了一种基于字和词混合语言模型的关键词检索方法及系统,所述方法包含:步骤101),根据词性区分训练语料中非常见词和常见词,为组成非常见词的各个字添加标识信息,将原训练语料划分为由常见词和标识非常见词信息的符号构成的新语料;根据新语料构建词的语言模型并根据原训练语料按单字重新训练一个语言模型进而得到字的语言模型;步骤102)构建主解码网络和子解码网络,基于主解码网络和子解码网络进行关键词检索;其中,当进行解码时由所述词的语言模型决定是否进入带有标识非常见词信息的节点,且带有标识非常见词信息的节点连接一个由全部单字构成的子解码网络,当进入子解码网络后由所述字的语言模型限制搜索范围。

    一种随机数字口令相关的说话人识别方法及装置

    公开(公告)号:CN110047491A

    公开(公告)日:2019-07-23

    申请号:CN201810039718.X

    申请日:2018-01-16

    Abstract: 本发明涉及随机数字口令相关的说话人识别方法及装置,该方法包括,获取注册说话人模型中对应数字的总变化因子向量和测试说话人语音中每个数字片段的总变化因子向量;将注册说话人模型中对应数字的总变化因子向量与测试说话人语音中每个数字片段的总变化因子向量,进行余弦打分,根据语音识别的置信度对打分进行加权求和,获得判决分数,识别测试说话人的语音是否为注册说话人的语音。本发明对注册和测试中对应数字的语音片段进行匹配打分,可在随机数字口令长度较短如5个随机数字的情况下,仍有很高的识别性能,与常用的高斯混合模型通用背景模型打分方法对比,本发明提出的随机数字口令的说话人识别方法的性能有相对25%-30%的提升。

    一种敲击弦乐器的音乐多音符估计方法及系统

    公开(公告)号:CN105304073B

    公开(公告)日:2019-03-12

    申请号:CN201410325609.6

    申请日:2014-07-09

    Abstract: 本发明涉及一种基于非负矩阵分解的敲击弦乐器的音乐多音符估计方法,该方法利用敲击弦乐器的单音音频数据构建音符能量谱包络基矩阵,通过对多音能量谱包络的非负矩阵分解,求得各音符在多音片段中的能量权重系数,最后对音符权重大小进行阈值限定求得多音片段中的多音符分布。与传统方法比较,基于非负矩阵分解的音乐多音符估计方法只利用了音符起始点处的能量谱包络信息,同时结合了能量谱包络的线性叠加性来分解能量谱,符合局部构建整体的音符叠加机理,多音符估计性能得到明显提升,同时系统速度也有一定提升,具有很高的实用性。

    一种基于统计语言模型得分规整的语音识别方法及系统

    公开(公告)号:CN109427330A

    公开(公告)日:2019-03-05

    申请号:CN201710790753.0

    申请日:2017-09-05

    Abstract: 本发明一种基于统计语言模型得分规整的语音识别方法,所述方法包括:步骤1)建立和训练若干个基于多尺度马尔科夫假设的统计语言模型;包括:k阶统计N元文法语言模型,k-1个不同阶数的统计N元文法语言模型和k-1个不同阶数的改进的统计N元文法语言模型;步骤2)将待识别语音进行第一遍解码,得到L条候选语音s;步骤3)利用步骤1)的若干个基于多尺度马尔科夫假设的统计语言模型计算L条候选语音s的语言模型得分,结合声学模型得分计算出每条候选语音的得分;步骤4)选出得分最高的候选语音作为第二遍解码结果;该结果为最终的识别结果。本发明的方法对于识别错误具有良好的容错性,能够有效的提升语音识别的正确率。

    一种低资源嵌入式语音识别的拒识方法

    公开(公告)号:CN105321518B

    公开(公告)日:2018-12-04

    申请号:CN201410387404.0

    申请日:2014-08-05

    Abstract: 本发明涉及一种低资源嵌入式语音识别的拒识方法,该方法包括:基于命令词表和垃圾音素列表,分别构建命令词解码网络和垃圾音素解码网络,将垃圾音素解码网络并联到命令词解码网络中,形成完整的解码网路空间;生成语音背景概率得分表。将待识别语音输入解码网络空间进行第一次识别:解码识别,对第一次识别结果中的垃圾因素拒识,再对第一次识别结果中的命令词进行第二次判别:置信度判别,得到最终识别结果。本方法可提高对集外词的拒识率,节省内存占用,满足了低资源条件嵌入式语音识别的应用需求。

    一种基于NMF算法的单传声器语音分离方法

    公开(公告)号:CN108573711A

    公开(公告)日:2018-09-25

    申请号:CN201710137777.6

    申请日:2017-03-09

    Abstract: 本发明提供了一种基于NMF算法的单传声器语音分离方法,该方法针对每个说话人的训练数据得到很多较小的字典矩阵和一个状态序列,以此来同时描述语音信号的谱结构信息和时间连续性;针对不同帧混合语音,相比于传统的算法采用了较大的字典矩阵而言,由于本发明的算法采用了不同的较小的字典矩阵来描述各帧语音幅度谱,避免了一个说话人的字典描述出另一个说话人的语音信息的现象发生,提高了算法的鲁棒性和语音分离效果。

    一种链路预测模型的建立及链路预测方法

    公开(公告)号:CN108270608A

    公开(公告)日:2018-07-10

    申请号:CN201710004638.6

    申请日:2017-01-04

    Abstract: 本发明提供了一种链路预测模型的建立方法,所述链路预测模型包括:时序受限玻尔兹曼机模型和梯度提升决策树模型;所述方法包括:从互联网或其它多媒体中抓取大量的网络数据,对网络数据进行预处理,将网络数据划分为历史数据和现有数据,输入时序受限玻尔兹曼机模型,训练出模型参数;提取网络数据节点对的网络拓扑特征,形成特征集并输入梯度提升决策树模型,训练出模型参数;所述链路预测模型包括训练好的时序受限玻尔兹曼机模型和梯度提升决策树模型。基于该方法建立的链路预测模型,本发明还提供了一种链路预测方法,该方法能够预测网络下一状态的所有链接。

Patent Agency Ranking