-
公开(公告)号:CN112232432A
公开(公告)日:2021-01-15
申请号:CN202011155107.5
申请日:2020-10-26
Applicant: 西安交通大学
IPC: G06K9/62
Abstract: 本发明公开了一种基于改进中心点检测的安检X光图像目标检测与识别方法,包含以下步骤:1、选取X‑Ray安检机拍摄的X光图像,标注图像中的目标并制作训练图像集;2、搭建CenterNet模型,引入高斯模型对网络的输出建模,修改损失函数,得到改进后的CenterNet模型;3、将训练图像集依次混合,旋转,竖直翻转进行数据增广,并用R,G,B,灰度,H五个通道表示,训练并保存改进后的CenterNet模型;4、进行安检X光图像目标检测与识别时,首先将安检X光图像进行预处理,再将其像素值归一化到标准正态分布,输入改进后的CenterNet模型进行推理,得到图像中目标检测与识别结果。本发明方法能够解决安检图像中目标互相遮挡,含有小目标,以及目标角度变化影响检测准确率的问题。
-
公开(公告)号:CN106384334A
公开(公告)日:2017-02-08
申请号:CN201610850366.7
申请日:2016-09-26
Applicant: 西安交通大学
IPC: G06T3/40
CPC classification number: G06T3/4038
Abstract: 本发明公开了一种基于互信息的钢板图像拼接方法,1、对于一副输入的钢板图像,首先使用Scharr算子来获得梯度图像,并对梯度图像进行零均值处理来进行归一化;2、对于两个待拼接的归一化的梯度图像,根据拼接参数获取其重叠区域,然后计算其统计直方图和联合概率直方图,接着利用求得的直方图计算两个统计量之间的互信息;随后对所有的拼接参数均计算得到其互信息结果,并选择取得最大互信息的拼接参数作为最优参数;然后将钢板宽度方向上所有钢板图像进行图像融合拼接在一起;该方法利用互信息来度量待拼接图像重叠部分的相似性,然后对拼接参数进行优化迭代地选择相邻时刻的最优参数,最后根据拼接参数对待拼接图像进行图像融合最终获得拼接后整张钢板的高分辨率图像。
-
公开(公告)号:CN103400109B
公开(公告)日:2016-05-25
申请号:CN201310289788.8
申请日:2013-07-10
Applicant: 西安交通大学
IPC: G06K9/00
Abstract: 一种手绘草图离线识别与整形方法,首先对输入图像预处理,然后将连通域中离散的、无序的点集转换为有序的点序列并压缩;随后采用动态规划算法对点序列进行多直线拟合,确定最优拟合直线的条数后,得到每个连通域的由直线表示的笔画;随后对多直线拟合后的笔画结果进行分析,若拟合出来的直线条数大于系统所能识别形状的最大边数,则对该笔画进行降阶处理,对其进行分类并计算笔画之间的距离,选取较近的笔画进行合并分析,并依赖几何特征进行验证确定输入笔画组合所构成的形状;本发明方法具有较高的识别率,且待识别形状有尺度不变性以及旋转不变性;本算法同时支持识别有限种形状的多笔画形式,克服完全基于几何特征进行识别时可能出现的问题。
-
公开(公告)号:CN101567049A
公开(公告)日:2009-10-28
申请号:CN200910022698.6
申请日:2009-05-26
Applicant: 西安交通大学
Abstract: 本发明涉及计算机视觉和图形、图像处理领域,公开了一种半色调文档图像的噪声处理方法。它包括以下步骤:首先,将半色调文档图像分为四类;其次,对于浅色背景和深色文字的半色调文档图像,采用基于连通区域标记的方法去除背景噪声;对于浅色背景和浅色文字的半色调文档图像,采用基于高斯平滑滤波的方法去除背景噪声;对于深色背景和深色文字的半色调文档图像、深色背景和浅色文字的半色调文档图像,采用基于维纳滤波的方法去除背景噪声;最后,观察去除背景噪声的半色调文档图像,构造文字的毛刺去除模板和缺陷修复模板,通过模板匹配去除文字毛刺和修复文字缺陷。
-
公开(公告)号:CN119762965A
公开(公告)日:2025-04-04
申请号:CN202411809108.5
申请日:2024-12-10
Applicant: 西安交通大学
IPC: G06V20/10 , G06V10/44 , G06V10/764 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/0895
Abstract: 本发明公开基于改善伪标签边界质量的超高分辨率遥感图像半监督变化检测方法,变化检测旨在发掘双时图像中后一时刻图像较前一时刻图像的变化区域;本发明通过高质量的伪标签,增强半监督学习引导,包含以下步骤:1、准备半监督学习训练数据集;2、搭建教师模型和学生模型;3、训练开始,学生模型对训练数据集数据进行推理,利用教师模型生成对应粗伪标签;4、使用边界优化方法对粗伪标签进行细化,计算标签的一致性损失与学生模型推理结果损失;5、计算总损失,学生模型和教师模型进行参数更新;6、训练结束,学生模型对遥感双时图像进行变化检测;本发明改善了受制于粗糙的伪标签边界而无法获得进一步提升的半监督变化检测性能。
-
公开(公告)号:CN114399623B
公开(公告)日:2024-04-16
申请号:CN202111450039.X
申请日:2021-11-30
Applicant: 西安交通大学
Abstract: 本发明公开了一种通用答题识别方法、系统、存储介质及计算设备,根据答题卡图片中三个黑色方块进行宏观定位,将答题卡图片裁剪缩放成统一的尺寸;根据每行选项最右端的黑色条形方块和最上方的黑色正方块,对答题卡图片上填涂的选项坐标进行识别,并根据各选项识别的像素大小,确定出客观题的答题结果;直至将答题卡图片中的全部问题识别完成;将识别出的填涂结果绘制成矩阵;分析数据结果,统计出作答成绩。本发明不使用专用的扫描设备对答题卡进行扫描,大大降低了购买和维护扫描设备的花销和成本,并且对答题卡打印的纸张和使用人员也没有特殊要求,能够更加简单且快捷地为用户统计答题卡的作答情况。
-
公开(公告)号:CN114399623A
公开(公告)日:2022-04-26
申请号:CN202111450039.X
申请日:2021-11-30
Applicant: 西安交通大学
Abstract: 本发明公开了一种通用答题识别方法、系统、存储介质及计算设备,根据答题卡图片中三个黑色方块进行宏观定位,将答题卡图片裁剪缩放成统一的尺寸;根据每行选项最右端的黑色条形方块和最上方的黑色正方块,对答题卡图片上填涂的选项坐标进行识别,并根据各选项识别的像素大小,确定出客观题的答题结果;直至将答题卡图片中的全部问题识别完成;将识别出的填涂结果绘制成矩阵;分析数据结果,统计出作答成绩。本发明不使用专用的扫描设备对答题卡进行扫描,大大降低了购买和维护扫描设备的花销和成本,并且对答题卡打印的纸张和使用人员也没有特殊要求,能够更加简单且快捷地为用户统计答题卡的作答情况。
-
公开(公告)号:CN111862223B
公开(公告)日:2022-03-22
申请号:CN202010778891.9
申请日:2020-08-05
Applicant: 西安交通大学
Abstract: 本发明公开了一种电子元件的视觉计数及定位方法,包含以下步骤:1、选取部分图像,标注电子元件重心并制作训练图像集;2、搭建神经网络模型,使用训练图像集训练并保存神经网络模型;3、对一张训练图像集之外的图像,首先经过预处理,检测并裁剪掉黑边;检测电子元件所在区域外围圆与内围圆;将外围圆最小外接正方形区域裁剪成图像集合;之后依次输入神经网络模型得到密度图矩阵集合;最后经过后处理,密度图矩阵合并;计算合并后密度图矩阵外围圆与内围圆之间的联通区域,得到电子元件图像中电子元件的计数与定位结果。本发明方法能够解决电子元件尺寸与形状差异过大以及部分电子元件之间粘连过大影响计数准确率的问题。
-
公开(公告)号:CN105528603B
公开(公告)日:2018-07-27
申请号:CN201510943600.6
申请日:2015-12-16
Applicant: 西安交通大学
IPC: G06K9/32
Abstract: 本发明公开种利用笔画对比和边缘密度特征滤除非文字边缘的方法,1、对于副输入图像,计算它在灰度通道上的边缘图,并从正反两面进行笔画宽度变换,得到笔画对数目向量和笔画宽度变换图;2、对边缘图像中的每条边缘,计算笔画对比;对每层笔画宽度变换图上的每个连通区域,计算该连通区域的边缘密度特征;对于每条边缘,如果其笔画对比小于预设阈值,则滤除该边缘;对于每个连通区域,如果其边缘密度大于预设阈值,则滤除该连通区域内所有的边缘连通分支;笔画宽度变换是种常用的文字区域粗定位方法,但很多非文字的边缘也会产生很多笔画,而笔画对比和边缘密度特征,可以去除大量的背景边缘,减少了后续步骤的处理难度。
-
公开(公告)号:CN107908685A
公开(公告)日:2018-04-13
申请号:CN201711047644.6
申请日:2017-10-31
Applicant: 西安交通大学
Abstract: 本发明公开一种基于迁移学习的多视角商品图像检索与识别方法,1、根据商品列表建立多视角图像基础库,接着借助迁移学习技术,使用少量商品图像对已预训练的深度残差网络进行微调,然后使用该网络对图像基础库提取特征,对特征降维后构建特征库,最后根据特征库、图像基础库和商品类别的对应关系建立映射表;2、在获得待识别的商品图像后,使用上述网络对该图像提取特征并降维;3、对待识别商品图片特征与基础库中各图片特征进行距离度量,距离最小的就是最相似的图片,将其作为匹配结果,最后通过映射表获得待识别图片的商品类别名称;本发明能够自动提取强表征能力的特征,进一步突破语义鸿沟,并且在只利用少量图像基础库和低维特征的情况下,提高检索效率和识别精度。
-
-
-
-
-
-
-
-
-