一种基于版式文件对电子文件矢量化的方法

    公开(公告)号:CN115346227B

    公开(公告)日:2023-08-08

    申请号:CN202211266067.0

    申请日:2022-10-17

    摘要: 本发明涉及图像识别技术领域,具体涉及一种基于版式文件对电子文件矢量化的方法,该方法包括:获取纸质文档的扫描位图;获取扫描位图对应的不同字体的矢量文字,获取文字及矢量文字的对应的外包围框内的二值图像,获取包围框中心点到闭合边缘上的距离并得到距离序列及距离序列集合;利用多个不同采样尺度对距离序列集合进行采样得到目标序列集合,计算文字及矢量文字对应的目标序列的相似度距离,并进行KM匹配,根据匹配后的目标序列的相似度距离获取匹配效果评价值,获取文字与对应字体的矢量文字的字体匹配度,确定文字的替换对象,并得到矢量化后的文件,本发明精确确定了与文字匹配的字体的矢量文字,从而精准实现文字的矢量化。

    图像矫正方法及其装置、设备、存储介质、产品

    公开(公告)号:CN115862022B

    公开(公告)日:2023-07-14

    申请号:CN202310046897.0

    申请日:2023-01-31

    摘要: 本申请公开一种图像矫正方法、装置、计算机设备及存储介质,包括:获取待处理的文档数据;将所述文档数据输入至预设的图像识别模型,其中,所述图像识别模型为预先训练之收敛状态,用于识别目标图像的神经网络模型;读取所述图像识别模型输出的图像分类信息,并根据所述图像分类信息提取所述文档数据中的目标图像;根据所述图像分类信息表征的图像类型,测量所述目标图像的目标偏转角度;根据所述目标偏转角度对所述目标图像进行图像矫正。对目标图像的偏转角度测量是根据目标图像的类型进行的,因此,能够避免不同图像种类采用同一测量方法导致偏转角度测量不准确的问题,进而提高了图像角度回归的准确率。

    图像文本的检测方法、装置、设备和可读存储介质

    公开(公告)号:CN116386064A

    公开(公告)日:2023-07-04

    申请号:CN202310217907.2

    申请日:2023-03-03

    摘要: 本发明公开了一种图像文本的检测方法、装置、设备和可读存储介质,该方法包括:获取待检测图像,其中,待检测图像包含文本内容和非文本内容;通过至少两种预处理算法对待检测图像进行特征处理,分别获得不同类型的特征图像,其中,预处理算法包括二值化算法和mser算法,预处理算法与特征图像唯一对应;将所有特征图像和待检测图像进行特征融合,获得多通道特征图像;将多通道特征图像输入至训练完成的文本检测模型中进行识别,得到文本内容的位置信息。基于对原始图像以及二值化的图像、mser算法处理后的图像进行特征融合,并对融合后的图像进行图像识别,在保留原始图像所有特征的基础上,避免了独立文字出现误检的情形,提高了图像文本识别结果的准确性。

    基于深度学习的交叠文本行定位分割方法及系统

    公开(公告)号:CN110956088B

    公开(公告)日:2023-06-30

    申请号:CN201911053860.0

    申请日:2019-10-31

    摘要: 本发明公开了一种基于深度学习的交叠文本行定位分割方法及系统,属于计算机视觉领域。该方法包括:对原始图像进行预处理;输入到已训练的实例分割全卷积神经网络中,输出非交叠文本行区域特征分数图、交叠文本行区域特征分数图以及文本行区域像素之间链接信息特征分数图;获取非交叠文本行区域和交叠文本行区域的轮廓;合并非交叠文本行区域至交叠文本行区域;对文本行区域进行四边形拟合,获取文本行区域的外接四边形,实现交叠文本行的定位分割。本发明能够非常有效的解决交叠文本行定位分割的难题,能够完成传统方法无法完成的任务。并且,只需要较少的训练数据和训练迭代轮次配合简单的后处理,就能达到很好的算法性能。

    线缆线号的检测方法、装置和电子设备

    公开(公告)号:CN113627430B

    公开(公告)日:2023-06-20

    申请号:CN202110933219.7

    申请日:2021-08-12

    摘要: 本发明提供一种线缆线号的检测方法、装置和电子设备。该方法包括:获取目标区域的图像数据;按照预设顺序,依次提取图像数据中与各线缆的线号相对应的感兴趣区域;对目标感兴趣区域进行光学字符检测,得到目标感兴趣区域中的目标字符图片;利用预先训练的字符识别模型对目标字符图片进行识别,得到目标感兴趣区域对应的第一线号名称;根据预设顺序,在预先获取的目标区域的布线数据中确定目标感兴趣区域对应的第二线号名称;根据第一线号名称和第二线号名称的匹配程度,输出与目标感兴趣区域相对应的线缆线号的检测结果。本发明能够同时提高线号的检测效率和检测准确率。

    一种基于DS证据理论的单一字符图像匹配识别方法

    公开(公告)号:CN115588204B

    公开(公告)日:2023-06-13

    申请号:CN202211167652.5

    申请日:2022-09-23

    摘要: 本发明公开了一种基于DS证据理论的单一字符图像匹配识别方法,包括:将待识别的单一字符图像A经灰度、二值化、边缘切割和缩放转化,得到图像E;采用圆周扫描和隔行展开两种方式分别得到字符样本库中各字符样本特征向量S1ii和S2ii、图像E的待识别字符特征向量w1和w2;逐一计算w1与每一S1ii、w2与每一S2ii的欧式距离,得到距离序列F1和F2;分别选取F1和F2中较小的n个值对应的字符样本并求并集,得到备选字符集合H;基于DS证据理论,计算备选字符集合H中每一个字符元素的DS融合匹配概率,取融合匹配概率最大的字符元素,作为图像A的匹配结果。基于此,本发明可有效保证字符识别的准确率和识别效率。