语音识别方法、装置、设备及存储介质

    公开(公告)号:CN117711379A

    公开(公告)日:2024-03-15

    申请号:CN202311730730.2

    申请日:2023-12-15

    Abstract: 本申请实施例公开了一种语音识别方法、装置、设备及存储介质,对语音进行特征提取,得到语音的各个语音帧的特征;通过端到端网络对各个语音帧的特征进行编码,得到各个语音帧的编码特征;通过端到端网络对各个语音帧的编码特征进行解码,得到多个字序列;通过第一解码网络对多个字序列进行解码,得到第一词序列;通过基于热词激励的第二解码网络对各个语音帧的编码特征进行解码,得到第二词序列;在第一词序列和第二词序列中筛选出置信度高的词序列作为语音识别结果。本申请提高了特定业务场景下热词的语音识别效果,实现了整个识别系统在通用语音识别效果与个性化需求之间的平衡。

    一种对象识别方法、装置、设备及存储介质

    公开(公告)号:CN113486804B

    公开(公告)日:2024-02-20

    申请号:CN202110769197.5

    申请日:2021-07-07

    Abstract: 本申请提供了一种对象识别方法、装置、设备及存储介质,其中,识别方法包括:获取目标异质场景中的待识别图像;基于预先建立的多个识别模型中的一个,对待识别图像中的待识别对象进行识别,多个识别模型采用目标异质场景中的训练样本集训练得到,每个识别模型根据对应的预测损失进行参数更新,每个识别模型对应的预测损失根据训练样本集的目标分类结果确定,训练样本集的目标分类结果通过对训练样本集分别在多个识别模型上的分类结果融合得到,训练样本集在一识别模型上的分类结果根据从该识别模型针对训练样本集中每个样本确定的特征表示向量中提取的唯一性特征向量确定。本申请提供的对象识别方法对目标异质场景中的图像具有较好的识别效果。

    人脸识别模型构建方法、人脸识别方法及相关装置

    公开(公告)号:CN111259738B

    公开(公告)日:2023-10-27

    申请号:CN202010020092.5

    申请日:2020-01-08

    Abstract: 本申请实施例公开了一种人脸识别模型构建方法、人脸识别方法及相关装置,方法包括:根据预先训练好的N个人脸识别教师模型和样本数子集更新原始类中心矩阵,得到更新后的N个原始类中心矩阵;获取当前训练周期的N个特征空间转换矩阵;根据N个特征空间转换矩阵和N个原始类中心矩阵,确定融合类中心矩阵;根据融合类中心矩阵和预设的监督损失函数对当前训练的人脸识别学生模型进行训练,得到训练后的人脸识别学生模型;若训练后的人脸识别学生模型满足预设条件,则确定当前训练的人脸识别学生模型收敛;若训练后的人脸识别学生模型不满足预设条件,则继续下一个训练周期,直至满足预设条件。本申请有利于提高人脸学生识别模型的效率和准确度。

    面部动作识别及模型训练的方法、装置、设备和存储介质

    公开(公告)号:CN114332711A

    公开(公告)日:2022-04-12

    申请号:CN202111646070.0

    申请日:2021-12-29

    Inventor: 奚昌凤 吴子扬

    Abstract: 本申请提供了一种面部动作识别及模型训练的方法、装置、设备和存储介质,其中模型训练方法包括:获得多个视频段样本;构建每个视频段样本的至少一个同源正样本对和至少一个同源负样本对;针对多个视频段样本构建至少一个非同源正样本对和至少一个非同源负样本对;基于多个视频段样本中的人脸图像样本,同源正样本对、同源负样本对、非同源正样本对及非同源负样本对,采用自监督学习方法训练面部动作特征模型,得到初始训练出的面部动作特征模型;利用标注有面部动作类别的多个面部图像样本,对该面部动作特征模型和面部动作分类器进行训练,得到包含面部动作识别模型。本申请的方案能够训练出可准确识别人脸面部动作的面部动作识别模型。

Patent Agency Ranking