-
公开(公告)号:CN113191406A
公开(公告)日:2021-07-30
申请号:CN202110415553.3
申请日:2021-04-19
Applicant: 金科智融科技(珠海)有限公司 , 北京工业大学
Abstract: 本发明公开了一种基于格拉姆矩阵的动漫图像分类方法。该方法设计了一种基于深度卷积神经网络和格拉姆矩阵的图像分类网络,该网络可以将输入图像分为动漫类与非动漫类。本发明具体包括如下步骤:(1)在网络上广泛搜集动漫图像和非动漫图像,建立数据集;(2)对动漫图像进行数据增广处理扩充训练数据集;(3)使用预训练的ResNet50网络提取图像的特征;(4)将所提取的特征展平并进行内积运算,从而生成包含图像风格信息的格拉姆矩阵;(5)将格拉姆矩阵输入到深度卷积神经网络中进行分类,得到输入图像是否为动漫图像的分类结果。本发明能够对动漫图像进行识别,为避免因动漫引起的侵权提供新的方案。
-
公开(公告)号:CN106845458B
公开(公告)日:2020-11-27
申请号:CN201710125697.9
申请日:2017-03-05
Applicant: 北京工业大学
Abstract: 本发明公开了一种基于核超限学习机的快速交通标识检测方法,属于图像信号处理及模式识别领域。首先,首先,读取原始样本图像,利用基于BING的objectness方法,产生可能包含交通标识的区域,提取候选区域的HOG特征,送入核超限学习机分类器中,得到最后的检测结果;本发明摒弃传统的滑动窗口扫描方法,使用BING算法减少搜索空间,提高检测速度。传统的ELM算法是单隐层结构,在分析复杂信号方面有很大的局限性,本发明采取KELM进行分类检测,核超限学习机可以使学习模型更加稳定、泛化性能更强,提升了检测性能,并且保持了ELM低耗时的优势。
-
公开(公告)号:CN110910447A
公开(公告)日:2020-03-24
申请号:CN201911057343.0
申请日:2019-10-31
Applicant: 北京工业大学
Abstract: 本发明公开了一种基于动静态场景分离的视觉里程计方法,该方法是一个深度卷积神经网络模型,能够通过帧间变化分析实现动静态场景分离,并利用可靠的静态场景信息实现相机位姿的计算。该模型由三个子任务构成,分别为深度估计、相机位姿估计、动态物体检测。与现有技术相比,本发明具有以下优点:1)模型通过帧间变化分析,利用动态场景中深度信息的不一致性以及光流信息实现对场景的动静态分离,在此基础上利用更加可靠的静态场景信息实现相机位姿估计;2)利用估计得到的深度信息和相机位姿变换信息,使用T时刻的图像合成T+1时刻的图像,利用T+1时刻的合成图及其原图实现自监督学习,无需监督学习需要的昂贵代价。
-
公开(公告)号:CN105426447B
公开(公告)日:2019-02-01
申请号:CN201510757225.6
申请日:2015-11-09
Applicant: 北京工业大学
Abstract: 一种基于超限学习机的相关反馈方法,本发明输入一副查询图像;对图像进行检索,得到检索结果,让用户对结果进行标记;对标记过的图像分别提取SIFT特征,Color特征,和LBP特征;利用三种特征训练三个基础分类器;将检索图库的图像分别放入三个基分类器当中,根据预测结果进行投票,对每一副未标记图片进行自动标记;重新训练更新分类器;对图库图片进行分类;返回结果。本发明建立在超限学习机的基础上,通过引入人类的查询意图,进行人机交互,有效的利用未标记图库图像来丰富学习数据,可以使图像反馈的精度大大提高,并且处理速度得到很好的控制,使图像在计算机中的表达更符合人类对图像语义的理解,使本发明具有良好的反馈效果。
-
公开(公告)号:CN104463890B
公开(公告)日:2017-05-24
申请号:CN201410800350.6
申请日:2014-12-19
Applicant: 北京工业大学
CPC classification number: G06K9/4671 , G06K9/3233 , G06K9/4623 , G06T5/10 , G06T7/13 , G06T7/174 , G06T7/269 , G06T2207/10012 , G06T2207/10021 , G06T2207/20021
Abstract: 本发明公开了一种立体图像显著性区域检测方法,包括:步骤1)对立体图像的左眼视图和右眼视图求出各像素点的流信息;步骤2)对流信息进行匹配,得到视差图;步骤3)选取左眼视图和右眼视图其中之一,分出T个不重叠的正方形图像块;步骤4)计算视差图上每个图像块的视差影响度;步骤5)计算所选取的左眼视图和右眼视图其中之一上每个图像块的中央偏置特征和空域不相似度,并视差影响度三者相乘,得到该图像块的显著值;步骤6)由图像块的显著值获得立体图像的显著灰度图。本发明提出一种基于视差影响度和空间不相似度的立体显著性提取方法,利用视差来获取深度信息,结合视觉中央偏置特征和空域不相似度来实现更精确地立体显著性区域检测。
-
公开(公告)号:CN103927533B
公开(公告)日:2017-03-01
申请号:CN201410143919.6
申请日:2014-04-11
Applicant: 北京工业大学
Abstract: 一种针对早期专利文档扫描件中图文信息的智能处理方法属于计算机图像处理领域。本发明将输入的专利文档扫描图像转化为二值二维矩阵后去除扫描图像中的颗粒噪声,即用算法实现以矩形框圈取切割目标的操作,得到若干个粗块,对每个粗块进行分类,标记并得到若干个文本块和若干个非文本块。对非文本块进行进一步的细切割操作,得到若干个细块。对每个细块进行分类,标记并得到若干个标号块和若干个非标号块。对非标号块进行分类,标记并得到若干个杂质块和若干个附图块。对标号块以及附图块进行对应的匹配,即将指定附图和与其对应的附图标号相匹配。本发明更准确地切割附图、识别附图标号信息和匹配附图与附图标号的关系。
-
公开(公告)号:CN103440511B
公开(公告)日:2016-11-02
申请号:CN201310397701.9
申请日:2013-09-04
Applicant: 北京工业大学
IPC: G06K9/66
Abstract: 本发明属于图像处理领域,公开了一种基于三角剖分的图像分类方法,包括:步骤一,输入训练图像;步骤二,检测训练图像集中每幅图像的所有兴趣点,得到每幅图像的点集;步骤三,对兴趣点进行三角剖分,利用角度值及其相邻边比值描述特征点的空间关系,得到图像描述子;步骤四,用图像描述子训练分类器;步骤五,输入测试图像,提取测试图像的图像描述子;步骤六,将测试图像的图像描述子输入分类器进行判别。本发明通过提取局部兴趣点并利用三角剖分技术建立图像的全局关系,得到了全局图像描述子。使用全局图像描述子训练分类器,用训练好的分类器预测图像类别。与传统方法相比,本发明图像描述子构建简单,速度快,效果好。
-
公开(公告)号:CN103793925B
公开(公告)日:2016-05-18
申请号:CN201410061301.5
申请日:2014-02-24
Applicant: 北京工业大学
CPC classification number: G06K9/4671 , G06K9/00711 , G06K9/00744 , G06K9/4652 , G06K9/52
Abstract: 本发明涉及一种融合时空特征的视频图像视觉显著程度检测方法,包括:将输入图像切分成图像块,并进行向量化;对所有向量通过主成分分析进行降维;计算每个图像块与其它所有图像块的不相似度,再结合图像块之间的距离计算得到每个图像块的视觉显著性程度,得到空间特征显著图;对空间特征显著图施加中央偏置;计算每个图像块的运动矢量,并结合前两帧的运动矢量提取当前图像块的运动特征,得到时间特征显著图;融合空间和时间特征显著图得到时空特征显著图,进行平滑后得到最终反映图像上各个区域显著程度的结果图像。本发明采用融合时空特征的显著图,能够更准确地预测视频中不同区域的显著程度。
-
公开(公告)号:CN105138672A
公开(公告)日:2015-12-09
申请号:CN201510564819.5
申请日:2015-09-07
Applicant: 北京工业大学
IPC: G06F17/30
CPC classification number: G06F17/30247 , G06F17/3025 , G06F17/30256
Abstract: 本发明公开了一种多特征融合的图像检索方法,其包括,步骤一、输入待检索图像I;步骤二、构建图像I的颜色特征向量和SIFT特征向量;步骤三,训练查询图库中的图像获得颜色特征词典和SIFT特征词典,用所述视觉单词表示图库中的图像;步骤四、用所述视觉单词表示所述图像I,根据所述视觉单词从所述查询图库中调取候选图像集Q,计算相似度值score(Q,I);步骤五、选取所述图像I中具有视觉显著性的局部区域Si并重复步骤三和步骤四获得候选图像集K,计算相似度值scoresal(K,I);步骤六、两个候选融合集的重叠图像集为D,融合scoresal(D,I)和score(D,I)计算最终相似性值score*(D,I);步骤七、中最终相似性值最高的图像作为所述待图像I的检索结果。本发明具有降低了图像噪声,提高检索准确性的优点。
-
公开(公告)号:CN103064921B
公开(公告)日:2015-12-09
申请号:CN201210559924.6
申请日:2012-12-20
Applicant: 北京工业大学
Abstract: 一种实现博物馆智能数字导游的方法涉及数字多媒体领域。本发明搭建高清图像数据库和定位用的低分辨率图像数据库;两个数据库均保存在服务器上两个库的图像均采用归一化坐标对齐;高清晰图像采用多分辨率的金字塔形式组织,金字塔的每一层分成图像块存储在服务器上;移动平台的相机拍摄照片,交由服务器;服务器实现定位,并将位置信息反馈给移动平台;移动平台将该位置以及缩小程度作为参数传递给服务器;服务器依据放大缩小程度值找到对应金字塔的层次,将所对应的图像块传输给移动平台;移动平台进行呈现。服务器实现定位采用SIFT特征。本发明采用拍照和基于内容的检索算法实现用户所关注区域的定位;融入高清晰数字图像作为展示内容。
-
-
-
-
-
-
-
-
-