一种基础心音识别方法及设备

    公开(公告)号:CN111938691A

    公开(公告)日:2020-11-17

    申请号:CN202010829479.5

    申请日:2020-08-18

    Abstract: 本发明涉及一种心音识别方法,包括:采集多个原始心音数据;对多个原始心音数据进行低通滤波,并计算多个原始心音数据所对应的同态包络;采用双门限法对多个同态包络进行筛选,得到至少一个备选心音数据段;将至少一个备选心音数据段进行短时傅里叶变换,得到至少一个备选心音数据段所对应的备选心音段时频谱;将至少一个备选心音段时频谱输入心音识别分支卷积神经网络进行分类,得到至少一个备选心音段时频谱的分类结果。

    语音关键词识别方法和装置

    公开(公告)号:CN111798840A

    公开(公告)日:2020-10-20

    申请号:CN202010688457.1

    申请日:2020-07-16

    Abstract: 本申请提供一种语音关键词识别方法和装置,从目标关键词的音频中提取出第一声学特征和第二声学特征,将第一声学特征和第二声学特征拼接为第一声学特征序列;从待识别的目标语音的音频中提取出第三声学特征和第四声学特征,将第三声学特征和第四声学特征拼接为第二声学特征序列;将第一、第二声学特征序列分别输入预先训练的第一模型和第二模型,输出第一、第二嵌入向量;计算第一嵌入向量与第二嵌入式向量之间的相似度,基于相似度确定目标语音中是否包含目标关键词。该方法使得输出的嵌入向量包含更多的上下文信息,改善了样例关键词识别的有效性。

    一种端到端远场语音识别方法及系统

    公开(公告)号:CN111179920A

    公开(公告)日:2020-05-19

    申请号:CN201911415037.X

    申请日:2019-12-31

    Abstract: 本发明提供一种端到端远场语音识别方法及系统。在一个实施例中,将多通道信号的频谱特征和空间特征进行融合,并输入掩蔽网络中计算多通道信号的掩蔽值;根据所述掩蔽值计算多通道信号的波束形成系数,并根据所述波束形成系数对多通道语音信号进行增强;将增强后的多通道信号输入到编码解码网络中进行声学建模和优化,并在优化过程中加入最大信噪比准则进行联合优化;将优化后的多通道信号作为最终识别结果,并输出。通过将神经网络波束形成和声学建模结合进行联合优化以及将最大信噪比优化准则和语音识别准则进行联合优化。解决了前端语音增强和语音识非一致优化的问题。

Patent Agency Ranking