人脸识别方法、装置及计算机可读介质

    公开(公告)号:CN109902546A

    公开(公告)日:2019-06-18

    申请号:CN201810523102.X

    申请日:2018-05-28

    Abstract: 本发明实施例涉及人脸识别技术领域,公开了一种人脸识别方法、装置及计算机可读介质,该方法包括:将第一视频数据中包含的n帧图像输入到特征提取网络分别进行人脸特征提取,得到与上述n帧图像一一对应的n个人脸特征矩阵;融合上述n个人脸特征矩阵得到上述待识别人脸的目标人脸特征矩阵;通过上述目标人脸特征矩阵对上述待识别人脸进行人脸识别,得到人脸识别结果;其中2≤n。本申请中,利用从视频数据中提取出的多个人脸特征融合后的人脸特征进行人脸识别,可以提高人脸识别的准确率。

    基于双向Ladder结构的人脸属性分类系统

    公开(公告)号:CN109886072A

    公开(公告)日:2019-06-14

    申请号:CN201811595193.4

    申请日:2018-12-25

    Inventor: 赫然 郑欣 黄怀波

    Abstract: 本发明涉及计算机视觉技术领域,具体涉及一种基于双向Ladder结构的人脸属性分类系统,旨在解决如何充分利用深度网络中不同层次的特征,以及不同层次特征与不同人脸属性之间的对应关系,以提高人脸属性分类的精确度。为此目的,本发明提供的基于双向Ladder结构的人脸属性分类系统包括双向Ladder自编码器模块、自适应注意力模块和自适应评分融合模块;双向Ladder自编码器模块包括编码器模块和解码器模块;自适应注意力模块包括多个注意力子模块;自适应评分融合模块配置为根据编码器模块的输出结果与注意力子模块输出的结果获取待测人脸图像的人脸属性分类结果。基于上述结构可以充分利用不同层次的编码特征和解码特征,提高人脸属性分类的精确度。

    人脸关键点定位方法及装置

    公开(公告)号:CN106599830A

    公开(公告)日:2017-04-26

    申请号:CN201611135718.7

    申请日:2016-12-09

    Abstract: 本发明公开了一种人脸关键点定位方法及装置。该方法包括:通过多任务卷积神经网络进行粗定位,确定人脸关键点大体位置;然后在关键点周围提取局部区域,通过全局级联卷积神经网络把关键点周围提取局部区域融合到一起,进行级联定位;最后在针对每个关键点单独训练卷积神经网络进行精细定位。本发明所用神经网络总体数目较少,定位效果相对较好。

    一种基于互正则化约束子空间表达的多视角数据聚类方法

    公开(公告)号:CN103617292B

    公开(公告)日:2017-02-22

    申请号:CN201310687876.3

    申请日:2013-12-16

    Abstract: 本发明公开了一种基于互正则化约束子空间表达的多视角数据聚类方法,该方法包括以下步骤:组成多视角数据库,提取不同视角数据的视角特征;选择互正则化方法,确定互正则化约束;基于一优化目标函数和不同视角数据的视角特征,得到所有样本的协同表示向量;将协同表示向量按照其所对应的样本顺序排序,得到子空间表达矩阵;对子空间表达矩阵进行处理,得到亲和矩阵;根据需要聚类的数目分割亲和矩阵,得到多视角数据库的样本聚类结果。本发明利用子空间表达来挖掘样本之间的隐含结构信息,采用两种互正则化方式来约束不同视角的子空间表达,以利用多视角的互补信息,进一步加强样本集隐含结构信息的表示,从而能够广泛的应用于多视角数据聚类。

    基于唇部运动的深度学习身份识别方法

    公开(公告)号:CN106295501A

    公开(公告)日:2017-01-04

    申请号:CN201610586012.6

    申请日:2016-07-22

    CPC classification number: G06K9/00335 G06K9/6256

    Abstract: 本发明公开了一种基于唇部运动的深度学习身份识别方法,所述方法主要包括视频数据采集、视频数据的预处理、深度神经网络模型的训练、特征的提取和比对等步骤。首先将采集到的视频数据生成为图像帧的形式,然后进行数据的初步筛选,再对筛选数据进行唇部区域的图像提取和视频图像帧数量的统一化操作,之后进行深度神经网络模型的训练,根据训练数据和测试数据的特征相似度比对得到身份识别结果及其正确率。本发明最大的特点是结合具有学习能力的卷积神经网络和长短时记忆神经网络,利用不同人说话的独特方式和唇部特征唯一性对不同身份的人进行识别确认,并且模型训练操作方便,简单易用。

    基于多任务自编码器的交互式人脸活体检测方法和装置

    公开(公告)号:CN106022264A

    公开(公告)日:2016-10-12

    申请号:CN201610339145.3

    申请日:2016-05-19

    CPC classification number: G06K9/00906

    Abstract: 本发明公开了一种基于多任务自编码器的人脸活体检测方法和装置。方法包括:通过摄像头进行人脸检测并且跟踪,获得人脸图像;提示用户做指定动作;根据所获得的人脸图像,通过多任务自编码器进行人脸关键点检测以及面部器官状态的判定;多任务自编码器进行人脸位置跟踪,并通过一段时间的视频判断用户是否做指定的动作,同时获取用户图片;重复步骤S2‑S4,经过预定时间后,根据用户完成指定动作情况判断活体检测是否成功。本发明通过多任务自编码器,既可以定位关键点,也可以自然的加入对指定各种动作的判断,在不增加额外模型运算的同时,能够有效的防止活体检测中的图像及视频攻击。

    基于多任务深度学习的自然图像美感质量评估方法

    公开(公告)号:CN105894025A

    公开(公告)日:2016-08-24

    申请号:CN201610195565.9

    申请日:2016-03-30

    CPC classification number: G06K9/6267 G06K9/6256

    Abstract: 本发明公开了一种基于多任务深度学习的自然图像美感质量评估方法。其中,该方法包括步骤1:对所述自然图像进行基于多任务深度学习的美感和语义特征的自动学习;步骤2:针对自动学习的结果,进行基于多任务深度学习的美感分类和语义识别,从而实现对自然图像的美感质量评估。本发明利用语义信息来辅助美感特征的表达学习,从而更加有效地进行美感质量评估,并且设计多种多任务深度学习网络结构来有效地利用美感和语义信息来获得高准确率的图像美感分类。本发明能应用于涉及图像美感质量评估的众多领域,包括图像检索、摄影学及相册管理等。

    一种基于互正则化约束子空间表达的多视角数据聚类方法

    公开(公告)号:CN103617292A

    公开(公告)日:2014-03-05

    申请号:CN201310687876.3

    申请日:2013-12-16

    CPC classification number: G06F17/30598 G06K9/6218

    Abstract: 本发明公开了一种基于互正则化约束子空间表达的多视角数据聚类方法,该方法包括以下步骤:组成多视角数据库,提取不同视角数据的视角特征;选择互正则化方法,确定互正则化约束;基于一优化目标函数和不同视角数据的视角特征,得到所有样本的协同表示向量;将协同表示向量按照其所对应的样本顺序排序,得到子空间表达矩阵;对子空间表达矩阵进行处理,得到亲和矩阵;根据需要聚类的数目分割亲和矩阵,得到多视角数据库的样本聚类结果。本发明利用子空间表达来挖掘样本之间的隐含结构信息,采用两种互正则化方式来约束不同视角的子空间表达,以利用多视角的互补信息,进一步加强样本集隐含结构信息的表示,从而能够广泛的应用于多视角数据聚类。

    一种基于结构先验知识的鲁棒生物特征识别方法

    公开(公告)号:CN103440504A

    公开(公告)日:2013-12-11

    申请号:CN201310418307.9

    申请日:2013-09-13

    Abstract: 本发明公开了一种基于结构先验知识的鲁棒生物特征识别方法,该方法包括:收集图像数据形成训练样本集和测试样本集;提取所述训练样本集中每个训练样本的特征向量,并将提取得到的特征向量组成字典矩阵X;基于所述字典矩阵X,通过优化算法计算得到与所述测试样本集中的每一测试样本对应的重构系数向量;基于所述字典矩阵X,使用与所述测试样本集中的每一测试样本对应的重构系数向量进行样本重构,得到与每一测试样本对应的分属于不同类别的重构测试样本,与相应测试样本最为接近的重构训练样本的类别即为所述测试样本的类别。本发明可以用在人脸识别等生物特征识别领域,能够有效处理存在遮挡噪声情况下的识别分类问题。

    基于视角一致性增强的三维数据生成方法及系统

    公开(公告)号:CN118762132B

    公开(公告)日:2024-12-10

    申请号:CN202411245377.3

    申请日:2024-09-05

    Abstract: 本公开提供了一种基于视角一致性增强的三维数据生成方法及系统。基于视角一致性增强的三维数据生成方法包括:获取三维数据生成模型输出的三维数据,作为目标三维数据;基于所述目标三维数据,渲染出与多个视角一一对应的多个原始二维视图;将至少一个原始二维视图和查询提示信息,输入多模态模型,得到所述多模态模型输出的查询结果;针对所述查询结果,对所述至少一个原始二维视图进行修正,得到至少一个修正后二维视图;基于所述至少一个原始二维视图和所述至少一个修正后二维视图,计算第一损失函数,并基于所述第一损失函数更新所述三维数据生成模型的模型参数;获取更新后的三维数据生成模型输出的三维数据。

Patent Agency Ranking