-
公开(公告)号:CN108109624B
公开(公告)日:2021-06-08
申请号:CN201611049017.1
申请日:2016-11-23
Applicant: 中国科学院声学研究所 , 北京中科信利技术有限公司
Abstract: 本发明提供了一种基于统计规律的中文词汇表未登录词比率的估计方法,利用本发明提供的估计方法,解决了无法直接计算中文词汇表未登录词比率的技术问题;相比于采用字错误率(CER)衡量方法,本发明的估计方法通过采用中文词汇表未登录词比率来衡量中文识别系统性能,不仅省去了解码语音数据的时间,从而缩短评价某个特定中文语音识别系统所需的时间,而且可以在中文语音识别系统搭建之初选择性能最佳的中文词汇表,进而得到性能最佳的中文语音识别系统。
-
公开(公告)号:CN111938691A
公开(公告)日:2020-11-17
申请号:CN202010829479.5
申请日:2020-08-18
Applicant: 中国科学院声学研究所 , 北京中科信利技术有限公司
Abstract: 本发明涉及一种心音识别方法,包括:采集多个原始心音数据;对多个原始心音数据进行低通滤波,并计算多个原始心音数据所对应的同态包络;采用双门限法对多个同态包络进行筛选,得到至少一个备选心音数据段;将至少一个备选心音数据段进行短时傅里叶变换,得到至少一个备选心音数据段所对应的备选心音段时频谱;将至少一个备选心音段时频谱输入心音识别分支卷积神经网络进行分类,得到至少一个备选心音段时频谱的分类结果。
-
公开(公告)号:CN111798840A
公开(公告)日:2020-10-20
申请号:CN202010688457.1
申请日:2020-07-16
Applicant: 中移在线服务有限公司 , 中国科学院声学研究所
Abstract: 本申请提供一种语音关键词识别方法和装置,从目标关键词的音频中提取出第一声学特征和第二声学特征,将第一声学特征和第二声学特征拼接为第一声学特征序列;从待识别的目标语音的音频中提取出第三声学特征和第四声学特征,将第三声学特征和第四声学特征拼接为第二声学特征序列;将第一、第二声学特征序列分别输入预先训练的第一模型和第二模型,输出第一、第二嵌入向量;计算第一嵌入向量与第二嵌入式向量之间的相似度,基于相似度确定目标语音中是否包含目标关键词。该方法使得输出的嵌入向量包含更多的上下文信息,改善了样例关键词识别的有效性。
-
公开(公告)号:CN111179920A
公开(公告)日:2020-05-19
申请号:CN201911415037.X
申请日:2019-12-31
Applicant: 中国科学院声学研究所
IPC: G10L15/20 , G10L21/02 , G10L21/0216
Abstract: 本发明提供一种端到端远场语音识别方法及系统。在一个实施例中,将多通道信号的频谱特征和空间特征进行融合,并输入掩蔽网络中计算多通道信号的掩蔽值;根据所述掩蔽值计算多通道信号的波束形成系数,并根据所述波束形成系数对多通道语音信号进行增强;将增强后的多通道信号输入到编码解码网络中进行声学建模和优化,并在优化过程中加入最大信噪比准则进行联合优化;将优化后的多通道信号作为最终识别结果,并输出。通过将神经网络波束形成和声学建模结合进行联合优化以及将最大信噪比优化准则和语音识别准则进行联合优化。解决了前端语音增强和语音识非一致优化的问题。
-
公开(公告)号:CN101447183A
公开(公告)日:2009-06-03
申请号:CN200810110479.9
申请日:2008-06-05
Applicant: 中国科学院声学研究所 , 北京中科信利技术有限公司
IPC: G10L15/00
Abstract: 本发明涉及一种应用于语音识别系统的高性能置信度处理方法,其框架是基于一遍语音识别解码完成,在一遍语音识别过程中得到多个知识源,通过多个知识源融合处理得到置信度。本发明的语音识别置信度评价方法,只使用了一遍语音识别解码,同时利用了多个知识源,与以往的方法相比,该方法在大幅提高计算速度的同时,也使置信度计算的结果更为准确有效。
-
-
-
-