语音唤醒方法、装置、设备及可读存储介质

    公开(公告)号:CN117789695A

    公开(公告)日:2024-03-29

    申请号:CN202311805097.9

    申请日:2023-12-25

    Abstract: 本申请公开了一种语音唤醒方法、装置、设备及可读存储介质,在获取待识别的语音信号之后,先获取预设唤醒词的语种信息,预设唤醒词的语种信息用于指示预设唤醒词中包含的唤醒词片段,以及每个唤醒词片段对应的语种;然后对语音信号按语种进行切分,得到语种片段集合,语种片段集合中包括至少一个语种片段;最后语种片段集合与预设唤醒词的语种信息的一致性,确定语音信号的唤醒结果为第一唤醒结果还是第二唤醒结果,第一唤醒结果用于指示唤醒成功,第二唤醒结果用于指示唤醒失败。该方案能够实现多个语种的唤醒词的语音唤醒以及由多个语种拼接得到的唤醒词的语音唤醒。

    语音关键词识别方法、装置、电子设备和存储介质

    公开(公告)号:CN110610707B

    公开(公告)日:2022-04-22

    申请号:CN201910891598.0

    申请日:2019-09-20

    Inventor: 申凯 张滔

    Abstract: 本发明实施例提供一种语音关键词识别方法、装置、电子设备和存储介质,其中方法包括:提取待识别词对应的语音数据中每一帧的声学状态后验概率分布向量;任一帧的所述声学状态后验概率分布向量包括所述任一帧相对于多个声学状态的后验概率;将所述语音数据中每一帧的所述声学状态后验概率分布向量输入至关键词识别模型,得到所述关键词识别模型输出的所述待识别词对应的关键词识别结果;所述关键词识别模型是基于样本词中每一样本帧的样本声学状态后验概率分布向量,以及所述样本词的关键词标识训练得到的。本发明实施例提供的方法、装置、电子设备和存储介质,能够提高识别精度,避免相似词的误判问题,提高响应准确率,优化用户体验。

    用于目标设备的语音识别方法、装置、设备及存储介质

    公开(公告)号:CN114171009A

    公开(公告)日:2022-03-11

    申请号:CN202111534483.X

    申请日:2021-12-15

    Inventor: 徐文娜 孙磊 申凯

    Abstract: 本发明提供一种用于目标设备的语音识别方法、装置、设备及存储介质,所述方法包括:获取音频信号,得到所述音频信号的声学特征,将所述声学特征输入第一声学模型,得到音素级特征与该音素级特征相关联的音素级概率向量;若所述目标设备的当前工作模式为唤醒模式,则将音素级概率向量输入预设的解码器以识别唤醒词,并在识别出唤醒词的情况下将目标设备的工作模式转换为命令词模式;若目标设备的当前工作模式为命令词模式,则将音素级特征输入第二声学模型,以在识别出命令词时触发所述目标设备执行所述命令词对应的动作。本发明可解决目前不同长度的命令词在通过解码网络时因为不等长比较而导致的串扰问题,有效地提升了命令词识别的正确性。

    语音识别方法及装置、语音识别模型的训练方法及装置

    公开(公告)号:CN114242064A

    公开(公告)日:2022-03-25

    申请号:CN202111674064.6

    申请日:2021-12-31

    Inventor: 郭朝辉 申凯 许丽

    Abstract: 本申请提供了一种语音识别方法及装置、语音识别模型的训练方法及装置,该方法应用于语音识别模型,包括:获取语音数据,语音数据包括待识别词语的信息;从语音数据中依次提取每个音频帧对应的语音特征:响应于语音特征累积到预设时长,确定预设时长内的每个音频帧对应的语音状态,其中语音状态用于表示音频帧在文字中的所在位置;根据语音状态确定识别结果,识别结果包括待识别词语中的单个文字。本申请的技术方案能够以极低的延迟识别出单个文字。

    语音关键词识别方法、装置、电子设备和存储介质

    公开(公告)号:CN110610707A

    公开(公告)日:2019-12-24

    申请号:CN201910891598.0

    申请日:2019-09-20

    Inventor: 申凯 张滔

    Abstract: 本发明实施例提供一种语音关键词识别方法、装置、电子设备和存储介质,其中方法包括:提取待识别词对应的语音数据中每一帧的声学状态后验概率分布向量;任一帧的所述声学状态后验概率分布向量包括所述任一帧相对于多个声学状态的后验概率;将所述语音数据中每一帧的所述声学状态后验概率分布向量输入至关键词识别模型,得到所述关键词识别模型输出的所述待识别词对应的关键词识别结果;所述关键词识别模型是基于样本词中每一样本帧的样本声学状态后验概率分布向量,以及所述样本词的关键词标识训练得到的。本发明实施例提供的方法、装置、电子设备和存储介质,能够提高识别精度,避免相似词的误判问题,提高响应准确率,优化用户体验。

    意图识别方法、装置、电子设备及存储介质

    公开(公告)号:CN115563277A

    公开(公告)日:2023-01-03

    申请号:CN202211178020.9

    申请日:2022-09-23

    Abstract: 本发明提供一种意图识别方法、装置、电子设备及存储介质,该方法包括:获取待识别文本;基于语言模型,提取所述待识别文本的文本意图特征;基于意图识别分支,确定所述文本意图特征对应的意图识别结果;其中,所述语言模型是结合掩膜预测分支进行掩膜预测训练,并结合所述意图识别分支进行意图识别训练得到的;所述掩膜预测训练是以携带掩膜的第一样本文本为样本、以预测所述第一样本文本中的掩膜部分为任务执行的,所述意图识别训练是以携带意图标签的第二样本文本为样本、以识别所述第二样本文本的意图为任务执行的。本发明提供的方法、装置、电子设备和存储介质,极大程度提升了意图识别的自由度,提高了意图识别的泛化能力。

    音素识别方法、装置、电子设备和存储介质

    公开(公告)号:CN115359783A

    公开(公告)日:2022-11-18

    申请号:CN202210855299.3

    申请日:2022-07-19

    Abstract: 本发明提供一种音素识别方法、装置、电子设备和存储介质,所述方法包括:确定待识别语音;将待识别语音输入至音素识别模型,得到音素识别模型输出的音素识别结果;音素识别模型基于多个语种的样本语音及各样本语音的音素级标签,对第一识别模型进行训练得到,第一识别模型是基于第二识别模型下各音素节点所对应音素之间的相似度,对第二识别模型下的音素节点进行筛选得到的,第二识别模型包括多个语种分别对应的音素节点。本发明提供的音素识别方法、装置、电子设备和存储介质,不仅减小了音素识别模型的规模,而且音素识别模型能够准确对不同语种的音素进行区分。

    语音唤醒方法、装置、电子设备和计算机可读存储介质

    公开(公告)号:CN119811384A

    公开(公告)日:2025-04-11

    申请号:CN202411940918.4

    申请日:2024-12-26

    Abstract: 本申请公开了一种语音唤醒方法、装置、电子设备和计算机可读存储介质,该方法包括:获取目标设备对应的目标注册唤醒音频以及用户输入的目标唤醒音频;分别获取目标唤醒音频对应的目标唤醒特征、以及目标注册唤醒音频对应的目标语音特征;对比目标唤醒特征和目标语音特征,得到目标唤醒结果;其中,目标唤醒结果用于指示是否对目标设备进行唤醒。通过上述方式,本申请能够语音唤醒的准确性。

    基于生成对抗网络的语音唤醒方法、装置及存储介质

    公开(公告)号:CN117690432A

    公开(公告)日:2024-03-12

    申请号:CN202311846228.8

    申请日:2023-12-27

    Abstract: 本申请公开了一种基于生成对抗网络的语音唤醒方法、装置、存储介质、电子设备及计算机程序产品,该方法包括:获取待识别的目标语音数据;对目标语音数据进行声学特征提取,得到目标声学特征;将目标声学特征输入语音识别模型中进行处理,语音识别模型包括解码器和已训练的生成对抗网络,生成对抗网络包括生成器和第一判别器,生成器用于根据目标声学特征生成目标编码特征;第一判别器用于根据目标编码特征输出第一判别结果;解码器用于根据预设唤醒词对目标编码特征进行解码,并输出解码分数;根据第一判别结果和解码分数,进行车载语音系统的唤醒操作,从而无需用户手动操作即可唤醒车载语音系统,简化了唤醒流程,用户体验感好。

    唤醒语音识别方法、装置、电子设备及存储介质

    公开(公告)号:CN118038863A

    公开(公告)日:2024-05-14

    申请号:CN202311718263.1

    申请日:2023-12-13

    Abstract: 本申请提出一种唤醒语音识别方法、装置、电子设备及存储介质,该方法包括:基于待识别语音的声学特征,从模型集合中确定出与所述声学特征适配的建模模型,并利用所述建模模型对所述声学特征进行特征建模处理,得到建模声学特征;所述模型集合包括用于对唤醒语音的声学特征进行建模的唤醒语音建模模型,以及用于对非唤醒语音的声学特征进行建模的非唤醒语音建模模型;基于所述建模声学特征,从所述待识别语音中识别唤醒语音。上述方案能够提高唤醒语音识别的准确度和识别效率。

Patent Agency Ranking