-
公开(公告)号:CN101794389A
公开(公告)日:2010-08-04
申请号:CN200910244271.0
申请日:2009-12-30
Applicant: 中国科学院计算技术研究所
IPC: G06K9/36
Abstract: 本发明提供了一种人脸图像光照预处理方法,包括下列步骤:1)在m个不同的截断尺度下,将人脸图像分别分解为与光照因素相对应的大尺度分量u和与人脸内在特征相对应的小尺度分量v,从而得到所述人脸图像的m个小尺度分量;2)计算相邻截断尺度下的小尺度分量之差得到所述人脸图像的m-1个尺度邻域分量;3)通过对最小的小尺度分量以及m-1个尺度邻域分量进行加权求和,得到所述人脸图像的光照预处理图像。本发明能够更加精确地捕捉和保留各种光照条件下的不同人的人脸图像的人脸内在特征,进而有效地增强人脸识别对光照变化的鲁棒性。
-
公开(公告)号:CN101751559A
公开(公告)日:2010-06-23
申请号:CN200910244605.4
申请日:2009-12-31
Applicant: 中国科学院计算技术研究所
IPC: G06K9/00
Abstract: 本发明提供一种人脸皮肤斑痣点检测方法,包括检测人脸图像中人脸皮肤上的斑痣点;计算人脸图像的斑痣点的显著性及特征,并根据所述显著性对所述斑痣点分层。本发明还提供了一种利用皮肤斑痣识别人脸的方法,包括:检测出待识别人脸图像上分层次的斑痣点;计算所述待识别人脸图像各层斑痣点与标准人脸图像中对应层次斑痣点之间的空间距离和相似度,进而计算每一层上所述待识别人脸图像与所述标准人脸图像间的相似度;根据所述待识别人脸图像与所述标准人脸图像在每一层上的相似度来计算这两幅图像之间的整体相似度。本发明提高了人脸识别的准确性。
-
公开(公告)号:CN101483542A
公开(公告)日:2009-07-15
申请号:CN200810056069.0
申请日:2008-01-11
Applicant: 中国科学院计算技术研究所
Abstract: 本发明公开了一种对网络流媒体音视频的多维度的访问量统计方法,包括步骤:设置不同形式的音视频访问量统计方法,根据不同形式的访问量统计方法,获取相应的音视频的用户访问的反馈信息;根据用户访问的反馈信息,进行不同的处理,得到不同形式的访问量统计方法的音视频访问量。所述设置不同形式的音视频访问量统计方法,包括:音视频被完整访问的访问量统计方法;或者音视频被访问一定时间的访问量统计方法;或者音视频中的一个片断被访问的访问量统计方法;或者音视频中的多个片段被访问多次的访问量统计方法中的一种或者一种以上的组合。
-
公开(公告)号:CN101419672A
公开(公告)日:2009-04-29
申请号:CN200810239203.0
申请日:2008-12-03
Applicant: 中国科学院计算技术研究所
Abstract: 本发明涉及一种同步采集人脸图像和注视视角的装置和方法,方法包括:图像采集设备采集被采集者的面部图像,步骤1,将位置跟踪器的接收器分别置于所述被采集者的头部、注视设备、和所述图像采集设备;步骤2,所述位置跟踪器的发射器发射信号,所述接收器接收所述信号,并生成所述接收器相对于所述发射器的位置数据和方向数据;步骤3,计算设备处理所述位置数据和方向数据,获得所述被采集者的注视视角;步骤4,所述计算设备存储所述面部图像和所述注视视角。本发明能够在采集图像的同时确定各部分空间位置,进一步获取图像采集设备的笛卡尔坐标系中,以欧拉角表示的视线注视方向。
-
公开(公告)号:CN1972440A
公开(公告)日:2007-05-30
申请号:CN200610165131.0
申请日:2006-12-13
Applicant: 北京大学 , 中国科学院计算技术研究所 , 中国网通集团宽带业务应用国家工程实验室有限公司
Abstract: 本发明涉及一种在IPTV中实现画中画的方法,其是将内容提供商提供的多媒体信号通过IPTV头端系统的视频转码转换成多个内容相同,尺寸不同的视频流,并复制分发到各边缘/分发服务器上,由边缘/分发服务器根据客户端对视频流的请求,利用时间戳信息,对客户端请求进行切换视频流的同步操作。本发明通过展现时间戳与解码时间戳的使用,不仅大大降低了对网络传输带宽和客户端硬件处理与存储空间的要求,还提供了现有画中画技术所不具备的交互性,可以在客户端实现众多对同步性要求较高的终端画中画技术处理。本发明的具体实施非常灵活,既可以在现有IPTV系统中不添加任何硬件处理与存储设备来实现,也可以通过添加适当的硬件处理与存储设备来优化或增加本发明的功能。
-
公开(公告)号:CN1908960A
公开(公告)日:2007-02-07
申请号:CN200510089006.1
申请日:2005-08-02
Applicant: 中国科学院计算技术研究所
IPC: G06K9/00
Abstract: 本发明公开了一种基于特征分组的多分类器组合人脸识别方法,包括:从原始图像中提取人脸区域,并对人脸区域做预处理;对预处理后的人脸区域做人脸特征提取;对所提取的人脸特征做特征分组,得到不同的人脸特征组;对人脸特征进行分组以后,为每个特征分组设计分量分类器;利用所得到的分量分类器做人脸识别,将各个分量分类器所得到的识别结果做组合,得到最终的人脸识别结果。本发明的优点在于:较大程度上解决了维数灾难问题,通过特征分组,无需降维,且避免了维数灾难问题的出现,从而降低了算法设计的计算复杂度;提高了人脸识别系统的识别性能。
-
公开(公告)号:CN1381802A
公开(公告)日:2002-11-27
申请号:CN01109580.6
申请日:2001-04-18
Applicant: 中国科学院计算技术研究所
Abstract: 一种比赛现场信息计算机处理、网上直播及辅助裁判的方法,计算机接收摄像机采集的比赛图像,并提取比赛数据,该比赛数据通过网络传送到比赛直播系统;该比赛直播系统通过网络传送比赛数据,再根据比赛数据生成比赛画面并将该画面播出;另外,计算机利用该比赛数据,并根据相应的比赛规则对现场比赛进行实时裁判,由此,在利用计算机获取比赛数据的基础上,实现了网络虚拟比赛直播及计算机辅助裁判。
-
公开(公告)号:CN113658582B
公开(公告)日:2024-05-07
申请号:CN202110800963.X
申请日:2021-07-15
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种音视协同的唇语识别方法和系统,基于视觉‑视觉、音频‑音频、视觉‑音频等三个层面的度量学习,三个度量学习机制的同时进行不仅缩短了训练时间和阶段,还能更好地进行视觉和音频两种模态间的协同学习。通过音频信息的帮助,本发明的视觉模型可以提取更有区分度的特征,从而提升唇语识别模型的性能。
-
公开(公告)号:CN114187623A
公开(公告)日:2022-03-15
申请号:CN202111304240.7
申请日:2021-11-05
Applicant: 中国科学院计算技术研究所
IPC: G06V40/16 , G06V40/20 , G06V10/774 , G06V10/764 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 一种面部动作单元识别模型训练方法,包括:将面部图像输入并行的第一主干网络和第二主干网络以分别获得其第一视角特征与第二视角特征,面部图像包括准确标注面部图像、不准确标注面部图像或无标注面部图像;第一干净网络和第一噪声网络分别根据第一视角特征预测对应的第一准确标签与第一不准确标签,第二干净网络和第二噪声网络分别根据第二视角特征预测对应的第二准确标签与第二不准确标签;或者第一干净网络根据第一视角特征预测对应的第一准确标签与第一伪标签,第二干净网络根据第二视角特征预测对应的第二准确标签与第二伪标签。本发明的方法能利用准确标签数据集、不准确标签数据集以及无标注标签数据集,训练出准确率更高、泛化性能更强的面部动作单元识别模型。
-
公开(公告)号:CN105718868B
公开(公告)日:2019-10-25
申请号:CN201610029680.9
申请日:2016-01-18
Applicant: 中国科学院计算技术研究所
IPC: G06K9/00
Abstract: 本发明提供了一种针对多姿态人脸的人脸检测系统,包括:前端检测器和后端检测器,其中,所述前端检测器包括至少一层分类器,每一层包含至少两个并列的针对不同姿态人脸的第一类分类器,用于对候选的人脸与非人脸窗口进行区分;所述后端检测器包括采用深度神经网络的第二类分类器,用于进一步区分所述前端检测器的检测结果中的人脸和非人脸。相应地,本发明还提供了一种人脸检测方法。在提升检测精度的同时,有效降低检测过程的计算开销,有效提高检测速度。
-
-
-
-
-
-
-
-
-