-
公开(公告)号:CN1756313A
公开(公告)日:2006-04-05
申请号:CN200410081023.6
申请日:2004-09-30
Applicant: 中国科学院计算技术研究所
Abstract: 本发明公开了一种运动视频的全景图合成方法,用于将一段运动视频中的多个视频帧合成为一个全景图,所述运动视频中包含有运动前景和背景,每一个视频帧中都包含有运动前景和部分背景,所述全景图中包含有该运动视频中的背景全貌和一系列运动前景;该方法包括:用所述多个视频帧生成一描述运动视频中背景全貌的背景全景图;分别提取出所述多个视频帧中的运动前景;将提取出的运动前景叠加到背景全景图中。本发明所述方法的优点在于:本方法对于摄影机运动剧烈或前景运动剧烈的情况也同样有效;最后得到的结果中前景非常清晰,能很好的表现出运动对象动作的过程和细节。
-
公开(公告)号:CN1224926C
公开(公告)日:2005-10-26
申请号:CN02154399.2
申请日:2002-12-04
Applicant: 中国科学院计算技术研究所
Abstract: 一种压缩域体育视频定位标题文字的方法,包括以下步骤:用8×8DCT块的高频系数能量检测出初步的文字区域;通过快速算法直接由8×8图像块的DCT系数得到其4个2×8子块的反映水平方向频率变化的高频DCT系数;由子块的高频系数的水平和垂直投影图将初检的文字区域分割成每块只含一行且水平方向相对独立的文字块;利用体育视频中文字的时间冗余特性过滤掉误检的文字块。本发明通过少量的运算在压缩域实现了文字的精确定位,具有很快的定位速度和较高的准确性,不仅可以用于体育视频,还可用于其他类视频如新闻视频中文字的定位。
-
公开(公告)号:CN111832406A
公开(公告)日:2020-10-27
申请号:CN202010508103.4
申请日:2020-06-05
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出的基于平衡分组Softmax的长尾目标检测方法与系统,该方法在网络结构上,改变网络的最后一个全连接层,对拥有不同训练样本数量的类别进行分组,将背景类别单独分为一组,在每组中都加入其它类别;在训练过程中,按照组内普通类别训练样本数量采样一定数量的其它类别样本进行训练,并在每个组内分别用Softmax函数激活并计算交叉熵损失;在测试过程中,在每个组内分别用Softmax函数激活,去掉组内其它类别,仅保留正常类别得分,用背景组的“其它”类别得分为所有正常类别加权,组成最终得分,用于后处理。该发明提升了在大规模长尾目标数据集上的目标检测以及实例分割性能。
-
公开(公告)号:CN110019812A
公开(公告)日:2019-07-16
申请号:CN201810164771.2
申请日:2018-02-27
Applicant: 中国科学院计算技术研究所
Abstract: 本发明涉及一种用户自生产内容检测方法和系统,包括:获取社交媒体中用户自生产内容的文本内容、图像内容和社交属性,并从文本内容中抽取词向量特征,从社交属性中抽取社交属性特征以及从图像内容中抽取图像特征;通过递归神经网络融合词向量特征和社交属性特征,得到文本、社交融合特征;根据递归神经网络得到注意力向量,并通过注意力机制将图像特征处理为注意力融合特征,将注意力融合特征与文本、社交融合特征相融合,生成多模态融合特征;利用多模态融合特征训练分类器,以检测社交媒体中指定的用户自生产内容。本发明通过深度神经网络,融合内容检测涉及的多种模态内容,能够全面地进行用户自生产内容检测,得到更加准确的检测结果。
-
公开(公告)号:CN105373795B
公开(公告)日:2018-12-04
申请号:CN201510599915.3
申请日:2015-09-18
Applicant: 中国科学院计算技术研究所
IPC: G06K9/46
Abstract: 本发明适用于图像检索技术领域,提供了一种二进制图像特征提取方法,所述方法包括:根据预设规则获取特征点的位置;选取若干像素点作为二进制比较点;以每个二进制比较点为中心,对所述二进制比较点进行高斯模糊处理;从所述二进制比较点所构成的所有二进制比较对中,选择若干对区分度最大且相关性最小的比较对;将选取的若干对二进制比较对,进行像素属性比较,生成二进制描述子;按预设规则,将所述二进制描述子转换为整数。本发明还提供了一种实现上述方法的二进制图像特征提取系统。借此,本发明参照人眼视网膜的成像原理,使后续图片匹配检索算法的效率大大提高。
-
公开(公告)号:CN104469372B
公开(公告)日:2018-09-07
申请号:CN201410638332.2
申请日:2014-11-06
Applicant: 中国科学院计算技术研究所
IPC: H04N19/42 , H04N19/176 , H04N19/88
Abstract: 本发明提供一种用于压缩微透镜阵列采集的光场图像的方法和系统,所述方法包括:从光场图像中分解出多幅微图像,其中每幅微图像由组成该光场图像的所有宏像素块中相同位置的像素点组成;将所述多幅微图像进行排序并按该顺序合成为无损视频文件;以及采用基于视频编码的方法对所述视频文件进行压缩。本发明适用于压缩由微透镜阵列获取的光场图像,能够达到较高的压缩比,并且具有较好的压缩性能。
-
公开(公告)号:CN105260739B
公开(公告)日:2018-08-31
申请号:CN201510603903.3
申请日:2015-09-21
Applicant: 中国科学院计算技术研究所 , 国家计算机网络应急技术处理协调中心
IPC: G06K9/62
Abstract: 本发明适用于图像检索技术领域,提供了一种面向二进制特征的图像匹配方法及其系统,所述方法包括:特征提取步骤:提取待检测的图片的多个特征点的信息以及多个所述特征点的第一二进制描述子;第一匹配步骤:将多个所述第一二进制描述子与预设的图片库中的所有图片的第二二进制描述子进行比较,找出与多个所述第一二进制描述子匹配数最多的第二二进制描述子所对应的第一图片;第二匹配步骤:将所述待检测的图片和所述第一图片进行特征点的信息的匹配,获得所述待检测图片的匹配结果信息。由此,本发明提高了图像匹配的准确性及速度。
-
公开(公告)号:CN105224619B
公开(公告)日:2018-06-05
申请号:CN201510599948.8
申请日:2015-09-18
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
Abstract: 本发明提出一种适用于视频/图像局部特征的空间关系匹配方法及系统,该方法包括获取所有所述视频/图像特征点的尺度信息,确定每个所述视频/图像特征点的局部邻域空间,获取所述局部邻域空间内所有所述视频/图像特征点的视觉关键词编码,对所述视觉关键词编码进行量化处理,生成新视觉关键词编码,对所述新视觉关键词编码进行排序,生成所述视频/图像特征点的空间关系编码;比较待匹配视频/图像特征点与所述视频/图像特征点的空间关系编码,构建关系矩阵,计算所述关系矩阵中所述待匹配视频/图像特征点与所述视频/图像特征点空间关系编码相似度,融合所述待匹配视频/图像特征点与所述视频/图像特征点的视觉相似度及空间关系编码相似度。
-
公开(公告)号:CN107784676A
公开(公告)日:2018-03-09
申请号:CN201710911885.4
申请日:2017-09-29
Applicant: 中国科学院计算技术研究所
Abstract: 本发明涉及一种基于自动编码器网络的压缩感知测量矩阵优化方法和系统,包括:获取原始图像作为训练数据,通过分割裁剪处理将训练数据分割多个图像块;根据预设的采样率和自动编码器网络对图像块进行采样,生成初步重建图;根据深度残差网络计算初步重建图和原始图像间的残差值;将残差值与初步重建图相融合,生成重建结果,并根据重建图和图像块建立损失函数,通过损失函数对自动编码器网络中的参数矩阵进行训练,最后将训练完成的自动编码器网络参数作为压缩感知测量矩阵。本发明通过自动编码器对数据维度的变换,模拟实现了图像从采集到重建的过程,其中采集过程的参数即为测量矩阵,并且得到的测量矩阵具有很好的重建质量。
-
公开(公告)号:CN104735138B
公开(公告)日:2018-01-09
申请号:CN201510102980.0
申请日:2015-03-09
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种面向用户生成内容的分布式采集方法,包括:1)根据采集页面的采集量和采集难度划分页面类型,基于页面类型构建采集任务并将其加入采集队列;其中,所述采集任务包括复合采集任务,所述复合采集任务根据采集量和采集难度将多个同类型的采集页面划入;2)并发地从所述采集任务队列取出采集任务,执行该采集任务并返回所采集的信息。本发明还提供了相应的分布式采集系统,包括主控节点和多个子节点,主控节点用于构建并维护采集任务队列;各个所述子节点用于并发地执行采集任务。本发明的采集速度快,显著地提高了UGC新闻采集的实时性;可以适用于各种不同类型页面的采集,执行多样化的采集任务;能够规避采集对象的监控措施。
-
-
-
-
-
-
-
-
-