一种显示设备及基于唤醒词声纹的指令识别方法

    公开(公告)号:CN118609575A

    公开(公告)日:2024-09-06

    申请号:CN202410772645.0

    申请日:2024-06-14

    摘要: 本申请提供一种显示设备及基于唤醒词声纹的指令识别方法,所述方法通过声音采集器获取待提取音频后,通过语音提取模型在待提取音频中识别唤醒词音频,并通过语音提取模型提取唤醒词音频的目标声纹向量,根据目标声纹向量在待提取音频中提取目标指令词音频,根据目标指令词音频生成控制指令,以及,响应于控制指令,控制显示器显示执行控制指令后的目标用户界面。本申请通过对唤醒词音频对应的声纹向量进行识别,并基于声纹向量获取有效的指令词音频以生成对应的控制指令,减少待提取音频中的其他指令词音频对有效指令词音频的干扰,提高显示设备识别指令的准确性。

    一种显示设备及语音识别方法
    2.
    发明公开

    公开(公告)号:CN118675521A

    公开(公告)日:2024-09-20

    申请号:CN202410733807.X

    申请日:2024-06-06

    发明人: 肖炳环 马明

    摘要: 本申请一些实施例提供一种显示设备及语音识别方法,所述方法可以响应于语音交互指令,对交互语音数据中的语音信号执行小波包分解,以获得不同频带的子信号。再从子信号中提取目标特征,以生成特征向量,其中,目标特征包括频带能量、移动有效值、频谱平坦度以及基音周期中的一项或多项的组合。通过将特征向量输入预训练的语音活动检测模型,以获得语音活动检测模型输出的语音识别结果,以根据语音端点在交互语音数据截取有效语音数据段,以及根据有效语音数据段执行语音交互。所述方法可以在时域或频域信号中分别进行特征提取,可节省计算时间,降低语音活动检测模型的网络结构层数,在满足实时响应性的同时降低能耗。

    一种语音去噪方法、装置和电子设备

    公开(公告)号:CN117809669A

    公开(公告)日:2024-04-02

    申请号:CN202311354637.6

    申请日:2023-10-18

    摘要: 本公开涉及语音处理技术领域,尤其涉及一种语音去噪方法、装置和电子设备,用于解决如何提升电子设备的语音识别的识别准确率的问题。该方法包括:获取待识别语音数据;对待识别语音数据进行小波包分解,得到至少一个实际子信号;基于实际子信号,确定每个实际子信号对应的第一参数信息;其中,第一参数信息包括实际子信号对应的实际频带的频带能量和实际子信号中共振峰的频带能量占比;基于第一参数信息和待识别语音数据的第二参数信息,确定每个实际子信号的增益值;其中,第二参数信息包括频谱平坦度和基因周期;基于每个实际子信号的增益值,以及每个实际子信号对应的实际频带的乘积,得到每个实际子信号对应的噪声抑制后的抑制频带;对抑制频带进行重构,得到去噪后的待识别语音数据。