对象重识别方法以及电子设备、存储装置

    公开(公告)号:CN113449596B

    公开(公告)日:2024-06-04

    申请号:CN202110580394.2

    申请日:2021-05-26

    Abstract: 本申请公开了一种对象重识别方法以及电子设备、存储装置,其中,对象重识别方法包括:提取待识别图像中目标对象的第一融合特征;基于第一数据库、第二数据库和第一融合特征,得到目标对象的轨迹信息和身份信息;其中,第一数据库包含若干预设对象的第二融合特征和身份信息,第二数据库包含视频数据中若干抓拍对象的第三融合特征和轨迹信息,且第一融合特征、第二融合特征和第三融合特征均是利用融合特征提取模型提取并处理人脸特征信息和形体特征信息而得到的。上述方案,能够提高对象身份以及轨迹识别的准确性。

    人脸识别模型构建方法、识别方法、装置、设备及存储介质

    公开(公告)号:CN111241992B

    公开(公告)日:2024-02-20

    申请号:CN202010018116.3

    申请日:2020-01-08

    Abstract: 本申请提供了一种人脸识别模型构建方法、识别方法、装置、设备及存储介质,其中,人脸识别模型构建方法包括:利用预先构建的、作为教师模型的人脸识别模型对标注有同一类别的多幅训练人脸图像分别提取人脸特征,获得多幅训练人脸图像分别对应的第一人脸特征;对多幅训练人脸图像分别对应的第一人脸特征进行聚类,并根据聚类结果确定多幅训练人脸图像分别所属类别的类中心;利用多幅训练人脸图像和多幅训练人脸图像分别所属类别的类中心,训练作为学生模型的人脸识别模型,对作为学生模型的人脸识别模型训练至收敛,得到构建出的人脸识别模型。本申请提供的人脸识别模型构建方法能够构建出识别速度快、识别精度高的人脸识别模型。

    视频人脸表情识别模型训练方法、装置、设备及存储介质

    公开(公告)号:CN115063858A

    公开(公告)日:2022-09-16

    申请号:CN202210716287.2

    申请日:2022-06-23

    Abstract: 本申请公开了一种视频人脸表情识别方法、装置、设备及存储介质,本申请获取人脸视频集合,该集合无需进行表情类型的标注,进一步可以利用携带有标注的训练数据训练初始表情分类模型,利用该模型对集合中每一视频段进行表情类型的预测,得到预测的伪标签,该伪标签可能会存在少量的误差,但是预测结果大部分还是正确的,本申请中以人脸视频集合中各视频段作为训练样本,参考伪标签基于对比自监督学习策略,对视频人脸表情识别模型进行预训练,采用这种训练方式无需提供有标注的训练数据,也即不需要大规模有标注人脸表情数据,同时通过对比学习策略,能够很好的学习到不同表情类型的表征特征,基于此训练的视频人脸表情识别模型的精度会更高。

    表情识别方法、装置、电子设备和存储介质

    公开(公告)号:CN114495230A

    公开(公告)日:2022-05-13

    申请号:CN202210100976.0

    申请日:2022-01-27

    Inventor: 奚昌凤 吴子扬

    Abstract: 本发明提供一种表情识别方法、装置、电子设备和存储介质,其中方法包括:基于编码网络,确定待识别的人脸图像的图像特征;基于表情提取网络,对图像特征进行表情特征提取,得到表情特征;基于表情分类网络,对表情特征进行表情识别;表情提取网络基于基准图像和第一图像之间的第一表情特征相似度,以及基准图像和第二图像之间的第二表情特征相似度训练得到,基准图像、第一图像和第二图像对应同一人脸,基准图像与第一图像间的时间间隔小于基准图像与第二图像间的时间间隔。本发明实施例提供的方法、装置、电子设备和存储介质,减少了人工标注成本的同时,有效提高了人脸表情识别结果的准确率和可靠性。

    流式语音交互方法及相关装置、设备和存储介质

    公开(公告)号:CN119694304A

    公开(公告)日:2025-03-25

    申请号:CN202510202865.4

    申请日:2025-02-24

    Abstract: 本申请公开了一种流式语音交互方法及相关装置、设备和存储介质,其中,流式语音交互方法包括:基于当前采集的第一流式语音进行第一分类,得到第一流式语音的第一预测类别;响应于第一预测类别为人声,至少基于第一流式语音进行第二分类,得到第一流式语音的第二预测类别;响应于第二预测类别为真实人声,至少基于第一流式语音进行第三分类,得到第一流式语音的第三预测类别;基于第三预测类别,对当前正在输出的机器对话内容执行目标交互操作。上述方案,能够尽可能地减少流式语音的误触发,提升流式语音交互的准确性。

    流式语音交互方法及相关装置、设备和存储介质

    公开(公告)号:CN119479620A

    公开(公告)日:2025-02-18

    申请号:CN202510026410.1

    申请日:2025-01-08

    Abstract: 本申请公开了一种流式语音交互方法及相关装置、设备和存储介质,其中,流式语音交互方法包括:对流式语音进行端点检测,并响应于检测到流式语音的起始端点,对流式语音执行滑窗操作,得到语音帧,基于语音帧进行特征提取,得到语音帧的语音特征;输入语音帧的语音特征至用于识别流式语音的语音识别系统,得到语音帧的识别结果,基于语音帧的编码特征进行分类预测,得到语音帧的分类结果;响应于分类结果表征语义结束,基于从起始端点至结束端点各个语音帧的识别结果,得到识别文本,至少基于识别文本由智能对话模型进行处理,生成得到回复文本;响应于分类结果表征语义未结束,继续返回执行滑窗操作。上述方案,能够提升流式语音交互的适时性。

    对象重识别方法以及电子设备、存储装置

    公开(公告)号:CN113449596A

    公开(公告)日:2021-09-28

    申请号:CN202110580394.2

    申请日:2021-05-26

    Abstract: 本申请公开了一种对象重识别方法以及电子设备、存储装置,其中,对象重识别方法包括:提取待识别图像中目标对象的第一融合特征;基于第一数据库、第二数据库和第一融合特征,得到目标对象的轨迹信息和身份信息;其中,第一数据库包含若干预设对象的第二融合特征和身份信息,第二数据库包含视频数据中若干抓拍对象的第三融合特征和轨迹信息,且第一融合特征、第二融合特征和第三融合特征均是利用融合特征提取模型提取并处理人脸特征信息和形体特征信息而得到的。上述方案,能够提高对象身份以及轨迹识别的准确性。

    一种人脸识别方法、系统及装置
    9.
    发明公开

    公开(公告)号:CN116486450A

    公开(公告)日:2023-07-25

    申请号:CN202310295775.5

    申请日:2023-03-22

    Abstract: 本申请公开了一种人脸识别方法、系统及装置,该方法包括:基于人脸识别模型进行人脸识别,得到待识别图像对应的人脸图像特征;模型训练过程包括:构建包含多个样本图像的训练样本集,将样本图像输入人脸识别模型,获得对应的初始图像特征;将初始类别特征的初始值处理为简化值,得到简化类别特征,将初始图像特征的初始值处理为简化值,得到简化图像特征;获得简化图像特征和各个简化类别特征之间的第一相似度,基于第一相似度从所有初始类别特征中获得样本图像对应的多个参考类别特征;基于所有样本图像对应的类别标签、初始图像特征和参考类别特征,调整人脸识别模型中的参数。通过上述方式,本申请能够提高人脸识别准确率,并节省计算成本。

    一种人脸识别方法、系统及相关装置

    公开(公告)号:CN116152895A

    公开(公告)日:2023-05-23

    申请号:CN202310115181.1

    申请日:2023-02-02

    Inventor: 吴子扬 奚昌凤

    Abstract: 本申请公开了一种人脸识别方法、系统及相关装置,该方法包括:基于人脸识别模型对待识别人脸图像进行人脸识别,得到对应的人脸图像特征;人脸识别模型的训练过程包括:获得初始图像,将初始图像的至少部分区域进行遮挡以获得遮挡图像;使人脸识别模型将遮挡图像分成多个第一图像块,将初始图像分成多个第二图像块,并为第一图像块设置对应的遮挡权重;基于第一图像块及其对应的遮挡权重,得到遮挡图像对应的遮挡图像特征;获得初始图像对应的参考图像特征,基于参考图像特征和遮挡图像特征,以及第一图像块对应的遮挡权重和遮挡比值调整人脸识别模型中的参数。通过上述方式,本申请能够提高对有遮挡人脸图像的识别能力。

Patent Agency Ranking