-
公开(公告)号:CN116704520A
公开(公告)日:2023-09-05
申请号:CN202310674144.4
申请日:2023-06-08
Applicant: 重庆大学
IPC: G06V30/19 , G06V30/413
Abstract: 本发明公开了一种海关随附单据信息提取系统,其包括OCR提取服务端和OCR提取客户端;所述OCR提取服务端包括信息提取设置前台、信息提取设置后台、提取设置数据库、心跳检测及提取设置更新模块、数据接收模块、历史数据管理模块和单据提取结果数据库;所述OCR提取客户端包括心跳上报及提取设置更新模块、原始单据获取模块、模板匹配模块、OCR处理模块和校正结果发送模块。本发明能将随附单据中的字符信息自动提取出来,并能有效应对海关随附单据表格样式多样、图像质量不高、单据图像倾斜、键值对分布无规律等缺点,提取结果具有较高的准确率,可用于海关风险甄别和决策,有利于提高海关风险防控的智能化水平和监管效率。
-
公开(公告)号:CN118155235A
公开(公告)日:2024-06-07
申请号:CN202410365007.7
申请日:2024-03-28
Applicant: 重庆大学
IPC: G06V30/42 , G06V30/413 , G06V10/82 , G06V30/262 , G06N3/0455 , G06N3/042 , G06N3/082
Abstract: 本发明涉及OCR信息提取技术领域,具体公开了一种海关M2M场景下的非结构化随附单据信息提取方法及系统,其基于增强型MobileNet‑V1网络和预训练的SVTR网络构建了基准模型,并构建了该基准模型的孪生模型,从而对该基准模型和孪生模型采用GTC训练策略及基于互学习的知识蒸馏优化方法进行训练,训练后的基准模型或孪生模型能够准确地提取海关非结构化随附单据中的编码类字段、字符类字段和数值类字段,显著提升了海关M2M场景下的信息提取准确率和结果置信度。另外,本发明还基于知识图谱提出了对模型识别结果的后处理方法,以对OCR识别结果进行校正校验,以进一步提升识别准确率。
-
公开(公告)号:CN117593758A
公开(公告)日:2024-02-23
申请号:CN202311597651.9
申请日:2023-11-28
Applicant: 重庆大学
IPC: G06V30/413 , G06V30/42 , G06V30/18 , G06V10/82 , G06N3/0464 , G06F40/30 , G06F40/289
Abstract: 本发明公开了一种识别海关单据图像中文字的方法,其包括构建用于文字识别的模型Swin‑TR,所述Swin‑TR由Swin‑T骨干、特征金字塔网络、自适应寻址和聚合模块三部分组成;训练Swin‑TR,在训练过程中分别计算字符A3模块、子词A3模块和整词A3模块的预测输出与真实标签的交叉熵,用训练合格的Swin‑TR识别单据图像中的文字。本发明识别海关单据图像中文字的方法能够准确地预测英文、中文字词以及标点符号,能够适应不同的文本识别场景,且通过实验与其它现有文本识别模型进行对比,证明了本发明方法提出的模型Swin‑TR比现有模型具有更高的文字识别准确性。
-
-