-
公开(公告)号:CN102436636A
公开(公告)日:2012-05-02
申请号:CN201010296746.3
申请日:2010-09-29
Applicant: 中国科学院计算技术研究所 , 日电(中国)有限公司
Abstract: 本发明涉及自动分割头发的方法及系统,方法包括:步骤1,对训练集和待分割的图像进行人脸检测,提取人脸部分的扩展图像;步骤2,对于训练集中的图像,根据标记的头发像素点建立通用头发特征统计模型,依据姿态进行分类,计算各类的位置先验模型;步骤3,对待分割的图像进行划分,确定待分割的图像所属的姿态类别,依据通用头发特征统计模型和所属姿态类别的位置先验模型选择头发种子和背景种子;步骤4,对头发种子建立头发特征统计模型,对背景种子建立背景特征统计模型;步骤5,根据待分割图像的头发特征统计模型和背景特征统计模型,及所属姿态类别的位置先验模型对待分割的图像进行头发分割。本发明能够解决多种人脸姿态的头发分割问题。
-
公开(公告)号:CN101609509B
公开(公告)日:2012-02-15
申请号:CN200810115330.X
申请日:2008-06-20
Applicant: 中国科学院计算技术研究所
IPC: G06K9/62
Abstract: 本发明提供一种基于预分类器的物体检测方法,包括下列步骤1)根据样本的多个局部区域内像素值的亮暗关系的组合计算特征;2)利用所述特征训练预分类器;3)应用所述预分类器对灰度图像进行检测,并进行后处理,得到物体窗口。本发明根据计算量有限,且描述能力强的特征进行预分类器的构建,并依此进行物体预检测,从而有效降低了物体检测的误检率,提高了物体检测的鲁棒性,而且还显著提高了物体检测的速度。
-
公开(公告)号:CN101159043B
公开(公告)日:2010-12-15
申请号:CN200710177656.0
申请日:2007-11-19
Applicant: 中国科学院计算技术研究所 , 中国科学院研究生院 , 北京工业大学
Abstract: 本发明公开了一种视觉目标上下文空间关系编码的系统和方法。该系统以神经元网络形式实现;包括视觉图像基元编码神经元层、视觉图像目标编码神经元层、视觉图像目标逻辑关系编码神经元层和视觉目标空间关系编码神经元层;所有相邻两层神经元之间的连接权值构成了对图像内容的编码,每个编码神经元及其连接权值分别编码图像基元、图像目标、目标二元逻辑关系和目标空间关系。其具有极大的灵活性和自适应性。
-
公开(公告)号:CN101419672B
公开(公告)日:2010-09-08
申请号:CN200810239203.0
申请日:2008-12-03
Applicant: 中国科学院计算技术研究所
Abstract: 本发明涉及一种同步采集人脸图像和注视视角的装置和方法,方法包括:图像采集设备采集被采集者的面部图像,步骤1,将位置跟踪器的接收器分别置于所述被采集者的头部、注视设备、和所述图像采集设备;步骤2,所述位置跟踪器的发射器发射信号,所述接收器接收所述信号,并生成所述接收器相对于所述发射器的位置数据和方向数据;步骤3,计算设备处理所述位置数据和方向数据,获得所述被采集者的注视视角;步骤4,所述计算设备存储所述面部图像和所述注视视角。本发明能够在采集图像的同时确定各部分空间位置,进一步获取图像采集设备的笛卡尔坐标系中,以欧拉角表示的视线注视方向。
-
公开(公告)号:CN100369047C
公开(公告)日:2008-02-13
申请号:CN200510068027.5
申请日:2005-04-30
Applicant: 中国科学院计算技术研究所
IPC: G06K9/00
Abstract: 本发明公开了一种基于Gabor相位模式的图像识别方法,包括:图像选取;对所要比较的图像做Gabor变换,每个图像得到各自的Gabor特征图谱;对Gabor特征图谱中的各个Gabor特征图提取全局Gabor相位模式;对Gabor特征图谱中的各个Gabor特征图提取局部Gabor相位模式;对全局Gabor相位模式和局部Gabor相位模式做统计,并将统计结果串接成高维特征向量;对图像的高维特征向量做比较,得到高维特征向量间的相似度,利用相似度识别图像。本发明的优点在于:能够保留纹理图像的结构信息,可用于对复杂图像的识别,识别精度高;能有效克服光照、姿态、老化和噪声等干扰因素的影响,识别效果好。
-
-
公开(公告)号:CN1150477C
公开(公告)日:2004-05-19
申请号:CN01109580.6
申请日:2001-04-18
Applicant: 中国科学院计算技术研究所
Abstract: 一种比赛现场信息计算机处理、网上直播及辅助裁判的方法,计算机接收摄像机采集的比赛图像,并提取比赛数据,该比赛数据通过网络传送到比赛直播系统;该比赛直播系统通过网络传送比赛数据,再根据比赛数据生成比赛画面并将该画面播出;另外,计算机利用该比赛数据,并根据相应的比赛规则对现场比赛进行实时裁判,由此,在利用计算机获取比赛数据的基础上,实现了网络虚拟比赛直播及计算机辅助裁判。
-
公开(公告)号:CN119181116A
公开(公告)日:2024-12-24
申请号:CN202310729598.7
申请日:2023-06-19
Applicant: 中国科学院计算技术研究所
IPC: G06V40/16 , G06V10/774 , G06T3/4053
Abstract: 本发明提出一种基于面部图像的视线方向估计方法,包括:构建并以源域数据训练视线估计模型和人像增强模型;从目标域中选取训练数据,以无监督学习方式训练该视线估计模型;将该目标域的目标图像通过该人像增强模型和该视线估计模型,获得该目标图像的视线方向估计结果。本发明还提出一种基于面部图像的视线方向估计系统,以及一种用于实现基于面部图像的视线方向估计的数据处理装置。
-
公开(公告)号:CN118397440A
公开(公告)日:2024-07-26
申请号:CN202410566933.0
申请日:2024-05-09
Applicant: 中国科学院计算技术研究所
IPC: G06V20/00 , G06V10/774 , G06V10/44 , G06V10/74 , G06V10/762
Abstract: 本发明提供了一种基于无监督域自适应的深度伪造检测方法,包括:通过源域的有标签数据训练一深度伪造检测模型,深度伪造检测模型至少包括有特征提取器;通过特征提取器,提取目标域的无标签数据的特征,并对无标签数据的特征进行聚类得到聚类结果;将目标域的聚类结果与源域的已知深度伪造类别进行匹配,为目标域的数据生成伪标签,伪标签包括已知深度伪造类别伪标签和未知深度伪造类别伪标签。通过源域的有标签数据和目标域的伪标签数据,对深度伪造检测模型进行再训练。本发明还提供一种系统、存储介质及电子设备。借此,本发明能够在不需要目标域标签的情况下,识别出目标域中的已知和未知的深度伪造类别,从而提高了模型的泛化能力和鲁棒性。
-
公开(公告)号:CN107330074B
公开(公告)日:2020-05-26
申请号:CN201710525604.1
申请日:2017-06-30
Applicant: 中国科学院计算技术研究所
IPC: G06F16/583 , G06F16/58 , G06K9/62
Abstract: 本发明涉及一种基于深度学习和哈希编码的模型训练方法,包括将部分标注的图像数据作为网络模型的训练数据,通过深度网络将所述训练数据表示为类二值哈希编码,其中,所述类二值哈希编码是指取值是连续值的一种模拟二值哈希编码;将获得的类二值哈希编码作为输入,连接到深度网络的一个或多个任务层,同时使用一个或多个任务进行训练;基于类二值哈希编码获得带有所述可供检索的特征信息的用于表示所述训练数据的二值哈希编码。
-
-
-
-
-
-
-
-
-