-
公开(公告)号:CN115346227B
公开(公告)日:2023-08-08
申请号:CN202211266067.0
申请日:2022-10-17
申请人: 景臣科技(南通)有限公司
IPC分类号: G06V30/41 , G06V30/416 , G06V30/162 , G06V30/18 , G06V30/19 , G06V30/244 , G06T11/20 , G06T11/60
摘要: 本发明涉及图像识别技术领域,具体涉及一种基于版式文件对电子文件矢量化的方法,该方法包括:获取纸质文档的扫描位图;获取扫描位图对应的不同字体的矢量文字,获取文字及矢量文字的对应的外包围框内的二值图像,获取包围框中心点到闭合边缘上的距离并得到距离序列及距离序列集合;利用多个不同采样尺度对距离序列集合进行采样得到目标序列集合,计算文字及矢量文字对应的目标序列的相似度距离,并进行KM匹配,根据匹配后的目标序列的相似度距离获取匹配效果评价值,获取文字与对应字体的矢量文字的字体匹配度,确定文字的替换对象,并得到矢量化后的文件,本发明精确确定了与文字匹配的字体的矢量文字,从而精准实现文字的矢量化。
-
公开(公告)号:CN116543412A
公开(公告)日:2023-08-04
申请号:CN202310264080.0
申请日:2023-03-18
申请人: 宝钢工程技术集团有限公司 , 宝武共享服务有限公司
发明人: 王光耀 , 张利勇 , 尤嘉庆 , 吴凤品 , 曲秀娟 , 韩轩 , 毛小春 , 侯立刚 , 吴坚华 , 王海江 , 王欢 , 刘瑜 , 顾欣 , 刘炎召 , 王森 , 胡南 , 顾伟香 , 陈鑫文 , 王硕
IPC分类号: G06V30/422 , G06V30/164 , G06V30/16 , G06V30/162
摘要: 本发明公开了一种根据图纸处理应用场景自动推送处理模块的方法,包括以下功能模块:图纸扫描输入及预处理模块、细化及矢量化处理模块、数据格式转换模块、图形编辑模块、帮助模块。本发明采用计算机自动处理与识别技术,将二值点阵图形信息通过预处理去噪声、细化处理、矢量化处理等环节,转换为矢量化图形信息存储,从而解决现存的大量工程老图纸输入计算机,实现图纸的计算机管理、检索、资源共享等;并能通过屏幕显示,对图纸进行编辑、修改得到新的设计图纸,在提高工作效率的同时也提升图纸处理的质量。
-
公开(公告)号:CN115862022B
公开(公告)日:2023-07-14
申请号:CN202310046897.0
申请日:2023-01-31
申请人: 深圳前海环融联易信息科技服务有限公司
IPC分类号: G06V30/146 , G06V30/148 , G06V30/162 , G06V30/18 , G06V30/19 , G06V10/82
摘要: 本申请公开一种图像矫正方法、装置、计算机设备及存储介质,包括:获取待处理的文档数据;将所述文档数据输入至预设的图像识别模型,其中,所述图像识别模型为预先训练之收敛状态,用于识别目标图像的神经网络模型;读取所述图像识别模型输出的图像分类信息,并根据所述图像分类信息提取所述文档数据中的目标图像;根据所述图像分类信息表征的图像类型,测量所述目标图像的目标偏转角度;根据所述目标偏转角度对所述目标图像进行图像矫正。对目标图像的偏转角度测量是根据目标图像的类型进行的,因此,能够避免不同图像种类采用同一测量方法导致偏转角度测量不准确的问题,进而提高了图像角度回归的准确率。
-
公开(公告)号:CN116386064A
公开(公告)日:2023-07-04
申请号:CN202310217907.2
申请日:2023-03-03
申请人: 广联达科技股份有限公司
IPC分类号: G06V30/24 , G06V30/146 , G06V30/148 , G06V30/162 , G06V30/18 , G06V30/19
摘要: 本发明公开了一种图像文本的检测方法、装置、设备和可读存储介质,该方法包括:获取待检测图像,其中,待检测图像包含文本内容和非文本内容;通过至少两种预处理算法对待检测图像进行特征处理,分别获得不同类型的特征图像,其中,预处理算法包括二值化算法和mser算法,预处理算法与特征图像唯一对应;将所有特征图像和待检测图像进行特征融合,获得多通道特征图像;将多通道特征图像输入至训练完成的文本检测模型中进行识别,得到文本内容的位置信息。基于对原始图像以及二值化的图像、mser算法处理后的图像进行特征融合,并对融合后的图像进行图像识别,在保留原始图像所有特征的基础上,避免了独立文字出现误检的情形,提高了图像文本识别结果的准确性。
-
公开(公告)号:CN116386059A
公开(公告)日:2023-07-04
申请号:CN202310154480.6
申请日:2023-02-22
发明人: 孔垂云 , 钟立民 , 吴志伟 , 高达 , 马志强 , 王瑞民 , 黄永亮 , 李楠 , 乔丽 , 王印 , 王铎 , 马丽静 , 赵彦龙 , 王彬 , 王成龙 , 吴爽 , 李博 , 刘慧贤 , 黄敏珍 , 林晓蕾
IPC分类号: G06V30/19 , G06V30/14 , G06V30/162
摘要: 本申请实施例提供了一种文字定位模型训练方法、训练装置、识别方法及识别装置,能够克服集装箱表面凹凸所带来的影响,提高文字定位模型的性能,进而提高对于集装箱号码识别的准确性。其中,文字定位模型训练方法包括:获取包含有车厢号码的M个车厢图像样本;基于最大的亮度和与剩余亮度和中任一亮度和的差值确定第一阈值,以及基于剩余亮度和中的每个亮度和确定对应的第二阈值;基于第一阈值对每个车厢图像样本进行二值化处理,获得第一二值化图像,基于第二阈值,对每个车厢图像样本进行二值化处理,获得第二二值化图像;获得M个融合图像样本;基于将M个融合图像样本作为训练样本对初始文字定位模型进行训练,获得目标文字定位模型。
-
公开(公告)号:CN110956088B
公开(公告)日:2023-06-30
申请号:CN201911053860.0
申请日:2019-10-31
申请人: 北京易道博识科技有限公司
IPC分类号: G06V30/40 , G06V30/148 , G06V30/162 , G06V30/19 , G06V10/82
摘要: 本发明公开了一种基于深度学习的交叠文本行定位分割方法及系统,属于计算机视觉领域。该方法包括:对原始图像进行预处理;输入到已训练的实例分割全卷积神经网络中,输出非交叠文本行区域特征分数图、交叠文本行区域特征分数图以及文本行区域像素之间链接信息特征分数图;获取非交叠文本行区域和交叠文本行区域的轮廓;合并非交叠文本行区域至交叠文本行区域;对文本行区域进行四边形拟合,获取文本行区域的外接四边形,实现交叠文本行的定位分割。本发明能够非常有效的解决交叠文本行定位分割的难题,能够完成传统方法无法完成的任务。并且,只需要较少的训练数据和训练迭代轮次配合简单的后处理,就能达到很好的算法性能。
-
公开(公告)号:CN113627430B
公开(公告)日:2023-06-20
申请号:CN202110933219.7
申请日:2021-08-12
申请人: 石家庄铁道大学
IPC分类号: G06V30/146 , G06V30/164 , G06V30/162 , G06V30/18 , G06V30/19
摘要: 本发明提供一种线缆线号的检测方法、装置和电子设备。该方法包括:获取目标区域的图像数据;按照预设顺序,依次提取图像数据中与各线缆的线号相对应的感兴趣区域;对目标感兴趣区域进行光学字符检测,得到目标感兴趣区域中的目标字符图片;利用预先训练的字符识别模型对目标字符图片进行识别,得到目标感兴趣区域对应的第一线号名称;根据预设顺序,在预先获取的目标区域的布线数据中确定目标感兴趣区域对应的第二线号名称;根据第一线号名称和第二线号名称的匹配程度,输出与目标感兴趣区域相对应的线缆线号的检测结果。本发明能够同时提高线号的检测效率和检测准确率。
-
公开(公告)号:CN115588204B
公开(公告)日:2023-06-13
申请号:CN202211167652.5
申请日:2022-09-23
申请人: 神州数码系统集成服务有限公司
IPC分类号: G06V30/19 , G06V30/18 , G06V30/162 , G06V30/148
摘要: 本发明公开了一种基于DS证据理论的单一字符图像匹配识别方法,包括:将待识别的单一字符图像A经灰度、二值化、边缘切割和缩放转化,得到图像E;采用圆周扫描和隔行展开两种方式分别得到字符样本库中各字符样本特征向量S1ii和S2ii、图像E的待识别字符特征向量w1和w2;逐一计算w1与每一S1ii、w2与每一S2ii的欧式距离,得到距离序列F1和F2;分别选取F1和F2中较小的n个值对应的字符样本并求并集,得到备选字符集合H;基于DS证据理论,计算备选字符集合H中每一个字符元素的DS融合匹配概率,取融合匹配概率最大的字符元素,作为图像A的匹配结果。基于此,本发明可有效保证字符识别的准确率和识别效率。
-
公开(公告)号:CN115909369B
公开(公告)日:2023-06-06
申请号:CN202310116030.8
申请日:2023-02-15
申请人: 南京信息工程大学 , 江苏少儿春互联教育科技有限公司
IPC分类号: G06V30/28 , G06V30/19 , G06V30/162 , G06V30/18 , G06V30/164 , G06V30/148 , G06V30/168 , G06V10/762
摘要: 本发明公开了一种汉字字体二值化切片图像的提取方法及系统,包括:对获取的RGB习字格书法图片进行处理得到灰度图片;从灰度图片提取最大的四边形轮廓,并对轮廓之外的噪声背景进行屏蔽处理;采用LSD直线检测算法在已屏蔽噪声背景的图片中提取水平和竖直方向上的习字格边框线条,剔除习字格虚线噪声的影响,得到水平习字格线条标记图和竖直习字格线条标记图;确定实际的习字格交叉关键点,得到各习字格的RGB切片图;对各切片图的灰度值进行聚类分析,得到二值化切片图像。本发明能够规避习字格辅助虚线、各种涂抹、拍照光线等因素的影响,对RGB习字格书法图片进行准确切片,同时对切片图进行二值化,准确地提取出手写汉字字体。
-
公开(公告)号:CN116189187A
公开(公告)日:2023-05-30
申请号:CN202211708195.6
申请日:2022-12-29
申请人: 无锡物联网创新中心有限公司
IPC分类号: G06V30/146 , G06V30/162 , G06V30/148 , G06V30/18 , G06V30/19 , G06V10/22 , G06V10/28 , G06V10/26 , G06V10/44 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/048 , G06N3/08
摘要: 本发明关于应用于厂区监控场景的铭牌颜色和文本一体化检测方法,涉及自然文字场景识别技术领域。该方法包括获取待测图片,待测图片中包括至少一个铭牌区域;确定与待测图片对应的光源颜色;对待测图片进行颜色校正;得到铭牌颜色信息以及铭牌位置信息;基于铭牌位置信息对铭牌区域进行裁剪,得到铭牌图片;得到与铭牌区域对应的文本内容。在获得具有铭牌区域的待测图片之后,通过铭牌识别模型确定铭牌所在位置,在通过OCR模型对于裁剪得到的铭牌图片进行识别,以得到与铭牌区域对应的文本内容。在此过程中,通过对于图片所在位置光源颜色的识别与调整,使得识别过程可以适配光源颜色不同的情况,进而提高对于铭牌的识别检测效率。
-
-
-
-
-
-
-
-
-