一种结构文本化营业执照图片的方法

    公开(公告)号:CN113869131B

    公开(公告)日:2024-03-29

    申请号:CN202111023703.2

    申请日:2021-09-01

    摘要: 本发明公开了一种结构文本化营业执照图片的方法,涉及结构文本化图片处理技术领域,使用了四个阶段对营业执照目标进行检测,营业执照文本进行检测,营业执照文字进行识别,文字内容进行结构化输出,该流程有效的规避了目前市场上大部分营业执照ocr识别算法对于复杂背景和一图多证的鲁棒性较差的痛点,同时弥补了主流方案对于输出文本结构化的匮乏,其可实现多场景多营业执照的自动检测以及文本内容结构化的智能提取,助力快速检索和采集入库公司营业执照信息,提升了工作效率。

    表格结构识别的方法、装置、存储介质及电子设备

    公开(公告)号:CN113297975B

    公开(公告)日:2024-03-26

    申请号:CN202110573789.X

    申请日:2021-05-25

    发明人: 张明

    摘要: 本公开涉及一种表格结构识别的方法、装置、存储介质及电子设备,可以将待识别表格对应的表格图像作为目标检测模型的输入,得到待识别表格中每个表格元素的位置特征和元素类别,元素类别包括文字行;通过文字识别模型对文字行进行文字识别,得到每个文字行的文本语义特征;通过图像特征提取模型对表格图像进行特征提取,得到图像特征图,并对图像特征图进行采样,得到每个表格元素分别对应的目标图像特征;根据位置特征、文本语义特征以及目标图像特征,通过预设关系提取模型得到用于表征待识别表格中每两个表格元素之间的拓扑关系的目标关系特征,根据目标关系特征通过预设分类模型确定用于表征待识别表格的表格结构的图邻接矩阵。

    一种基于单据的身份获取方法、系统、设备及介质

    公开(公告)号:CN117746446A

    公开(公告)日:2024-03-22

    申请号:CN202311618210.2

    申请日:2023-11-29

    摘要: 本发明提供一种基于单据的身份获取方法、系统、设备及介质,包括:通过对单据中的文字内容进行分析和处理,利用自然语言处理以及图像识别处理,来提取单据开具方或单据接收方的身份信息。本发明利用自然语言及图像识别技术,可以准确地识别单据上的信息,减少了错误率;同时,本发明通过自动化识别技术,能够节省人力成本,提高工作效率。此外,本发明可以快速、准确地获取单据身份信息,为用户提供便捷、高效的服务,提升了用户的体验感。所以,相对于传统的人工查找单据身份信息的方法,本发明具有更高的效率、更低的错误率、更低的成本以及更好的用户体验,具有明显的优越性。

    基于AI技术的平立面图数据处理方法及处理终端

    公开(公告)号:CN117745997A

    公开(公告)日:2024-03-22

    申请号:CN202410191987.3

    申请日:2024-02-21

    摘要: 本发明公开了一种基于AI技术的平立面图数据处理方法及处理终端,所述平立面图数据处理方法包括:预处理应用场景的平面图和立面图获取数据结构匹配的平面图和立面图;对于数据结构匹配的平面图和立面图中的每一幅设计图,利用AI识别技术获取设计图中各图层的语义信息;利用语义信息提取设计图中的几何形状并获取不同设计图之间几何形状的几何约束;利用几何形状建立设计图三维空间模型;利用几何约束将平面图和立面图的三维空间模型拼接;根据拼接结果获取平面图和立面图的匹配数据。本发明能够自动实现图纸审核,图纸的审查效率更高而且能够避免出现信息遗漏,提高审查图纸的准确率。

    一种基于表格线的图片信息结构化的方法和装置

    公开(公告)号:CN117711006A

    公开(公告)日:2024-03-15

    申请号:CN202311849003.8

    申请日:2023-12-29

    IPC分类号: G06V30/414 G06V30/148

    摘要: 本发明提供了一种基于表格线的图片信息结构化的方法和装置,包括:利用图像分割模型提取票据图片中的表格线,并基于表格线检测连通域,对连通域中的表格线进行后处理以实现对表格线的合并得到合并后表格线;对票据图片进行文本块检测,并基于文本块的相对位置进行文本块分行;根据文本块与各合并后表格线的相对位置进行文本块分组;基于文本块分行结果和文本块分组结果确定参考行,依据参考行对所有文本块进行再次分行,这样能实现图片信息的准确结构化。

    一种目标检测网络训练及目标检测方法、终端及存储介质

    公开(公告)号:CN117711005A

    公开(公告)日:2024-03-15

    申请号:CN202311848589.6

    申请日:2023-12-28

    摘要: 本发明提供一种目标检测网络训练及目标检测方法、终端及存储介质,目标检测网络的训练方法包括:获取训练数据组;训练数据组包括包含目标的样本图像以及图像文本提示信息;训练数据组关联有目标的类别标签、目标标注框;将样本图像和图像文本提示信息输入目标检测网络进行特征融合和目标检测,得到目标对应的预测类别、目标预测框;基于训练数据组中目标对应的预测类别与类别标签之间的差值、目标预测框与目标标注框之间的差值对目标检测网络进行迭代训练。本申请基于样本图像以及样本图像对应的图像文本提示信息对目标检测网络进行训练,提高目标检测网络的检测准确率。

    一种文档识别智能校对系统及方法

    公开(公告)号:CN117636374A

    公开(公告)日:2024-03-01

    申请号:CN202210989861.1

    申请日:2022-08-18

    发明人: 张旭

    摘要: 本发明属于文档识别智能校对系统技术领域,具体涉及一种文档识别智能校对系统及方法,包括:文本定位模块,用于实现自动化文本定位;图片倾斜矫正模块,用于把图片矫正为正确格式数据;表格切割模块,用于将一图多个表格数据进行表格切割;OCR识别模块,用于对文本进行识别;表格提取模块,用于提取结构化数据;数据核对模块,用于针对识别结果设置算法置信度并针对错误率判定较高的进行高亮提示辅助人工校对,本发明可自动识别pdf文件并提取相应的表格内容并按原有表格还原至excel文档,系统支持左右对照人工审核,针对识别置信度的内容进行高亮提取,提高了人工提取核对效率,准确率校对后可达到100%。

    一种文本校正方法及其系统

    公开(公告)号:CN112036398B

    公开(公告)日:2024-02-23

    申请号:CN202011104094.9

    申请日:2020-10-15

    摘要: 本发明提供了一种文本校正方法及其系统,所述校正方法包括如下步骤:获取文本图像,基于图像检测模型对所述文本图像进行检测以得到所述文本图像的区域边界坐标;通过所述区域边界坐标确定校正后的文本图像尺寸;根据校正后的文本图像尺寸对所述文本图像进行感兴趣区创建、并对圈定的感兴趣区进行切割、融合以实现对所述文本图像的校正。本发明的文本校正方法能对任意方向文本行和弯曲文本进行较好校正,从而提升后续基于字符分割和基于序列识别的文本识别的准确度。

    一种基于身份识别的智慧印章的方法

    公开(公告)号:CN117557213A

    公开(公告)日:2024-02-13

    申请号:CN202311409384.8

    申请日:2023-10-27

    摘要: 本发明公开了一种基于身份识别的智慧印章的方法,属于图片处理技术领域,包括需求模块、提取模块、核对模块、印章管理模块和智能签约模块,解决了提高企业用章效率,提高用章文件审批过程的安全性和合规性的技术问题,本发明提高审批流程效率,节省时间和减少审批周期,提高准确性,确保只有合法身份的审批者才能参与审批,减少了潜在的错误和非法审批,提高了数字印章的安全性,确保文件的完整性和合法性,提高可追溯性,减少了纸质文件和手工处理的需求,降低了文件审批过程的成本,员工可以从任何地方访问文件审批系统,不受时间和地点的限制,提高了操作的便捷性,系统可以根据企业的需求进行定制,以适应不同审批流程和政策。