一种海关随附单据信息提取系统
    1.
    发明公开

    公开(公告)号:CN116704520A

    公开(公告)日:2023-09-05

    申请号:CN202310674144.4

    申请日:2023-06-08

    Applicant: 重庆大学

    Abstract: 本发明公开了一种海关随附单据信息提取系统,其包括OCR提取服务端和OCR提取客户端;所述OCR提取服务端包括信息提取设置前台、信息提取设置后台、提取设置数据库、心跳检测及提取设置更新模块、数据接收模块、历史数据管理模块和单据提取结果数据库;所述OCR提取客户端包括心跳上报及提取设置更新模块、原始单据获取模块、模板匹配模块、OCR处理模块和校正结果发送模块。本发明能将随附单据中的字符信息自动提取出来,并能有效应对海关随附单据表格样式多样、图像质量不高、单据图像倾斜、键值对分布无规律等缺点,提取结果具有较高的准确率,可用于海关风险甄别和决策,有利于提高海关风险防控的智能化水平和监管效率。

    海关M2M场景下的非结构化随附单据信息提取方法及系统

    公开(公告)号:CN118155235A

    公开(公告)日:2024-06-07

    申请号:CN202410365007.7

    申请日:2024-03-28

    Applicant: 重庆大学

    Abstract: 本发明涉及OCR信息提取技术领域,具体公开了一种海关M2M场景下的非结构化随附单据信息提取方法及系统,其基于增强型MobileNet‑V1网络和预训练的SVTR网络构建了基准模型,并构建了该基准模型的孪生模型,从而对该基准模型和孪生模型采用GTC训练策略及基于互学习的知识蒸馏优化方法进行训练,训练后的基准模型或孪生模型能够准确地提取海关非结构化随附单据中的编码类字段、字符类字段和数值类字段,显著提升了海关M2M场景下的信息提取准确率和结果置信度。另外,本发明还基于知识图谱提出了对模型识别结果的后处理方法,以对OCR识别结果进行校正校验,以进一步提升识别准确率。

Patent Agency Ranking