-
公开(公告)号:CN113658582B
公开(公告)日:2024-05-07
申请号:CN202110800963.X
申请日:2021-07-15
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种音视协同的唇语识别方法和系统,基于视觉‑视觉、音频‑音频、视觉‑音频等三个层面的度量学习,三个度量学习机制的同时进行不仅缩短了训练时间和阶段,还能更好地进行视觉和音频两种模态间的协同学习。通过音频信息的帮助,本发明的视觉模型可以提取更有区分度的特征,从而提升唇语识别模型的性能。
-
公开(公告)号:CN115223225A
公开(公告)日:2022-10-21
申请号:CN202210853332.9
申请日:2022-07-08
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种由底向上的层次化人脸属性识别方法,包括:对人脸图像执行图像分析,得到人脸信息;从人脸信息得到底层人脸属性的识别结果;以及,根据底层人脸属性与上层人脸属性之间的语义关系,从底层人脸属性的识别结果得到上层人脸属性的识别结果。本发明可以高效、准确地获取人脸属性识别结果,并且可扩展性高。
-
公开(公告)号:CN114742972A
公开(公告)日:2022-07-12
申请号:CN202210367566.2
申请日:2022-04-08
Applicant: 中国科学院计算技术研究所
Abstract: 本申请提供了基于人脸RGB图像的三维人脸重建方法及装置,通过第一级残差网络回归三维形变模型的几何系数和颜色系数;基于这些系数重构三维人脸形状,并将该三维人脸形状投影、渲染得到二维人脸图像;将该二维人脸图像和原始RGB作为输入提供给第二残差网络回归几何系数和颜色系数的残差,将第一级残差网络得到的系数和第二残差网络得到系数的残差相加,得到最终的三维形变模型系数。通过这种两阶段的残差网络结构,实现了更加精确的系数回归,提高了人脸重建精度。
-
公开(公告)号:CN114187623A
公开(公告)日:2022-03-15
申请号:CN202111304240.7
申请日:2021-11-05
Applicant: 中国科学院计算技术研究所
IPC: G06V40/16 , G06V40/20 , G06V10/774 , G06V10/764 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 一种面部动作单元识别模型训练方法,包括:将面部图像输入并行的第一主干网络和第二主干网络以分别获得其第一视角特征与第二视角特征,面部图像包括准确标注面部图像、不准确标注面部图像或无标注面部图像;第一干净网络和第一噪声网络分别根据第一视角特征预测对应的第一准确标签与第一不准确标签,第二干净网络和第二噪声网络分别根据第二视角特征预测对应的第二准确标签与第二不准确标签;或者第一干净网络根据第一视角特征预测对应的第一准确标签与第一伪标签,第二干净网络根据第二视角特征预测对应的第二准确标签与第二伪标签。本发明的方法能利用准确标签数据集、不准确标签数据集以及无标注标签数据集,训练出准确率更高、泛化性能更强的面部动作单元识别模型。
-
公开(公告)号:CN105718868B
公开(公告)日:2019-10-25
申请号:CN201610029680.9
申请日:2016-01-18
Applicant: 中国科学院计算技术研究所
IPC: G06K9/00
Abstract: 本发明提供了一种针对多姿态人脸的人脸检测系统,包括:前端检测器和后端检测器,其中,所述前端检测器包括至少一层分类器,每一层包含至少两个并列的针对不同姿态人脸的第一类分类器,用于对候选的人脸与非人脸窗口进行区分;所述后端检测器包括采用深度神经网络的第二类分类器,用于进一步区分所述前端检测器的检测结果中的人脸和非人脸。相应地,本发明还提供了一种人脸检测方法。在提升检测精度的同时,有效降低检测过程的计算开销,有效提高检测速度。
-
公开(公告)号:CN110163106A
公开(公告)日:2019-08-23
申请号:CN201910319715.6
申请日:2019-04-19
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种一体式纹身检测与识别方法和系统,包括将输入图像输入至包括多层残差网络的主干网络,得到图像的卷积特征,将卷积特征输入至区域候选框网络,检测得到纹身候选框,识别网络根据纹身候选框的位置,将纹身候选框内目标区域的特征池化到统一维度分别进行纹身分类和位置回归,得到图像中纹身类别和精确候选框,通过特征学习将精确候选框和卷积特征投影到一个L2归一化的多维子空间中,得到实值向量,二值化实值向量作为输入图像的二值编码;根据待查询二值编码和所有候选二值编码之间的汉明距离,将候选纹身图象按照汉明距离从小到大排序,作为与待查询图像的纹身识别结果。本发明包括纹身检测并提取纹身特征,特征代表性强,过程简洁。
-
公开(公告)号:CN110097049A
公开(公告)日:2019-08-06
申请号:CN201910267048.1
申请日:2019-04-03
Applicant: 中国科学院计算技术研究所 , 中科视拓(北京)科技有限公司
Abstract: 本发明提出一种自然场景文本检测方法及系统,包含两个神经网络模型:基于多层次语义特征融合的文本检测网络和基于注意力机制的检测筛选网络。文本检测网络是一个基于FCN的图像特征提取融合网络,该网络用于提取输入数据的多语义层次信息,并进行多尺度特征的充分融合,最后通过对融合的多尺度信息进行卷积操作,预测自然场景中的文本信息的位置和置信度。检测筛选网络是利用训练好的卷积循环神经网络对第一部分的卷积神经网络输出的初始检测结果进行判别评分从而过滤掉易与前景文字混淆的背景,从而进一步提升自然场景文本识别的准确率。
-
公开(公告)号:CN109785298A
公开(公告)日:2019-05-21
申请号:CN201811593474.6
申请日:2018-12-25
Applicant: 中国科学院计算技术研究所
IPC: G06T7/00
Abstract: 本发明涉及一种多角度物体检测方法,包括:以深度神经网络构建检测模型;对训练图提取特征以获得多个特征图,设置多个垂直矩形锚框,获取该垂直矩形锚框与该训练图的样本物体的相交比,并以该相交比大于正例阈值的垂直矩形锚框标记为该训练图的样本物体的正例;通过该特征图对每个该正例进行回归预测,获取该样本物体的倾斜椭圆锚框的特征参数,以对该检测模型进行学习;以该检测模型检测目标图,获取该目标图中物体的倾斜椭圆锚框。
-
公开(公告)号:CN103970771B
公开(公告)日:2016-12-28
申请号:CN201310035131.9
申请日:2013-01-29
Applicant: 中国科学院计算技术研究所 , 日电(中国)有限公司
IPC: G06F17/30
Abstract: 本发明公开了一种人体的检索方法和系统。包括:图片存在判断步骤,判断是否存在待查询人体的图片,如果存在进入第一检索步骤,否则进入第二检索步骤;第一检索步骤,使用待查询人体的人体底层表观特征对人体数据库中的人体进行筛选,生成第一检索结果;在第一检索结果中,使用待查询人体的人体高层属性特征的集合,对第一检索结果中的人体进行筛选,生成最终检索结果,检索结束;第二检索步骤,确定检索方式,根据检索方式使用待查询人体的人体高层属性特征对人体数据库中的人体进行筛选,生成人体数据库的最终检索结果,检索结束。本发明实现了更准确和更快速地进行人体检索。
-
公开(公告)号:CN105718868A
公开(公告)日:2016-06-29
申请号:CN201610029680.9
申请日:2016-01-18
Applicant: 中国科学院计算技术研究所
IPC: G06K9/00
Abstract: 本发明提供了一种针对多姿态人脸的人脸检测系统,包括:前端检测器和后端检测器,其中,所述前端检测器包括至少一层分类器,每一层包含至少两个并列的针对不同姿态人脸的第一类分类器,用于对候选的人脸与非人脸窗口进行区分;所述后端检测器包括采用深度神经网络的第二类分类器,用于进一步区分所述前端检测器的检测结果中的人脸和非人脸。相应地,本发明还提供了一种人脸检测方法。在提升检测精度的同时,有效降低检测过程的计算开销,有效提高检测速度。
-
-
-
-
-
-
-
-
-