-
公开(公告)号:CN106997597A
公开(公告)日:2017-08-01
申请号:CN201710173134.7
申请日:2017-03-22
Applicant: 南京大学
CPC classification number: G06T2207/10016 , G06T2207/20081 , G06T2207/20156
Abstract: 本发明公开了一种基于有监督显著性检测的目标跟踪方法,包含:将当前帧的搜索区域分割为超像素并提取目标和背景的超像素特征,利用SVM学习目标的判别式表观模型。每来新一帧的图像,对搜索区域进行超像素分割,利用基于图模型的流形排序进行第一阶段的显著性检测。根据判别式表观模型计算新一帧图像中每个超像素属于目标的概率,调整分类结果并结合第一阶段的显著性检测选取随机游走的种子点,通过随机游走得到第二阶段显著图。将显著图与分类结果加权得出置信图,对置信图进行处理后用积分图法估计目标新的位置和尺度。本发明能够有效处理快速运动和形变等问题,从而实现鲁棒的跟踪。
-
公开(公告)号:CN104331717B
公开(公告)日:2017-10-17
申请号:CN201410693888.1
申请日:2014-11-26
Applicant: 南京大学
IPC: G06K9/66
Abstract: 本发明公开了一种整合特征字典结构与视觉特征编码的图像分类方法,包含如下步骤:视觉特征提取;特征字典学习;视觉特征编码;特征编码的空间汇合;训练与分类。本发明能获取更为准确的图像特征表示,提升图像分类的准确率。此外,通过将特征字典中的结构信息整合到视觉特征编码过程,得到更有判别性的图像特征表示,因此使得对图像的分类更加有效。本发明实现了高效、准确的图像分类,因此具有较高的使用价值。
-
公开(公告)号:CN105469096A
公开(公告)日:2016-04-06
申请号:CN201510794428.2
申请日:2015-11-18
Applicant: 南京大学
CPC classification number: G06K9/4647 , G06F17/30256 , G06K9/6223
Abstract: 本发明公开了一种基于哈希二值编码的特征袋图像检索方法,包含如下步骤:视觉词汇表建立;视觉词汇的tf-idf(词频-逆文本频率指数)权值量化;图像的视觉词汇特征量化;建立倒排索引;学习特征二值编码的投影方向;特征的二值编码量化;检索候选图像集合。本发明能够对图像数据库建立索引,实现快速的图像检索,提高了检索效率。此外,通过具有相似性保留能力的二值编码学习方法,并且从空间距离相似性与语义距离相似性学习二值编码作为签名,提高了图像检索的准确率。本发明实现了高效、准确的基于哈希二值编码的特征袋图像检索技术,因此具有较高的使用价值。
-
公开(公告)号:CN106997597B
公开(公告)日:2019-06-25
申请号:CN201710173134.7
申请日:2017-03-22
Applicant: 南京大学
Abstract: 本发明公开了一种基于有监督显著性检测的目标跟踪方法,包含:将当前帧的搜索区域分割为超像素并提取目标和背景的超像素特征,利用SVM学习目标的判别式表观模型。每来新一帧的图像,对搜索区域进行超像素分割,利用基于图模型的流形排序进行第一阶段的显著性检测。根据判别式表观模型计算新一帧图像中每个超像素属于目标的概率,调整分类结果并结合第一阶段的显著性检测选取随机游走的种子点,通过随机游走得到第二阶段显著图。将显著图与分类结果加权得出置信图,对置信图进行处理后用积分图法估计目标新的位置和尺度。本发明能够有效处理快速运动和形变等问题,从而实现鲁棒的跟踪。
-
公开(公告)号:CN105469096B
公开(公告)日:2018-09-25
申请号:CN201510794428.2
申请日:2015-11-18
Applicant: 南京大学
Abstract: 本发明公开了一种基于哈希二值编码的特征袋图像检索方法,包含如下步骤:视觉词汇表建立;视觉词汇的tf‑idf(词频‑逆文本频率指数)权值量化;图像的视觉词汇特征量化;建立倒排索引;学习特征二值编码的投影方向;特征的二值编码量化;检索候选图像集合。本发明能够对图像数据库建立索引,实现快速的图像检索,提高了检索效率。此外,通过具有相似性保留能力的二值编码学习方法,并且从空间距离相似性与语义距离相似性学习二值编码作为签名,提高了图像检索的准确率。本发明实现了高效、准确的基于哈希二值编码的特征袋图像检索技术,因此具有较高的使用价值。
-
公开(公告)号:CN104331717A
公开(公告)日:2015-02-04
申请号:CN201410693888.1
申请日:2014-11-26
Applicant: 南京大学
IPC: G06K9/66
CPC classification number: G06K9/66
Abstract: 本发明公开了一种整合特征字典结构与视觉特征编码的图像分类方法,包含如下步骤:视觉特征提取;特征字典学习;视觉特征编码;特征编码的空间汇合;训练与分类。本发明能获取更为准确的图像特征表示,提升图像分类的准确率。此外,通过将特征字典中的结构信息整合到视觉特征编码过程,得到更有判别性的图像特征表示,因此使得对图像的分类更加有效。本发明实现了高效、准确的图像分类,因此具有较高的使用价值。
-
-
-
-
-