一种海关发票实时识别的模型压缩方法

    公开(公告)号:CN115062776A

    公开(公告)日:2022-09-16

    申请号:CN202210742542.0

    申请日:2022-06-27

    Abstract: 本发明公开了一种海关发票实时识别的模型压缩方法,涉及海关票据文字识别和模型压缩技术领域,解决了票据识别模型复杂且识别精度不高的技术问题,其技术方案要点是构建复杂、高计算量的teacher模型和轻量化、低计算量的student模型;使用票据识别数据对teacher模型进行训练,获取高识别精度模型;根据teacher模型和student模型的网络结构设计基于注意力的自适应知识蒸馏框架;通过基于注意力的自适应知识蒸馏框架将高精度的teacher模型向未训练的student模型进行知识蒸馏;在知识蒸馏的基础上使用票据数据对student模型进行训练,最终获得高精度的、轻量化的、实时的票据识别模型。

    一种海关数据的关口预测方法、装置及存储介质

    公开(公告)号:CN114971001B

    公开(公告)日:2025-05-06

    申请号:CN202210546521.1

    申请日:2022-05-18

    Applicant: 南京大学

    Abstract: 本发明公开了一种海关数据的关口预测方法、装置及存储介质,方法包括:将海关每条多属性数据转换为二维矩阵;将得到的二维矩阵与常数一维卷积得到组合基础关键词信息;将基础关键词特征输入个体注意力模块和一个关系注意力模块,提取关键词的特征和不同关键词之间的关系特征;将二维矩阵输入双向长短期神经网络中,将输出特征输入注意力机制模块中,提取原始文本的时序特征;将两个模块得到的特征向量融合,最后通过一个全连接的softmax分类层得到关口预测的条件概率。本发明结合海关实际电商数据部分字段丢失以及关键词显著的特点,提出了关键词特征融合模型,有效地提取关键词属性特征以及长程的关键词关系,为解决关口预测问题提供了有效的方法。

    一种海关数据的关口预测方法、装置及存储介质

    公开(公告)号:CN114971001A

    公开(公告)日:2022-08-30

    申请号:CN202210546521.1

    申请日:2022-05-18

    Applicant: 南京大学

    Abstract: 本发明公开了一种海关数据的关口预测方法、装置及存储介质,方法包括:将海关每条多属性数据转换为二维矩阵;将得到的二维矩阵与常数一维卷积得到组合基础关键词信息;将基础关键词特征输入个体注意力模块和一个关系注意力模块,提取关键词的特征和不同关键词之间的关系特征;将二维矩阵输入双向长短期神经网络中,将输出特征输入注意力机制模块中,提取原始文本的时序特征;将两个模块得到的特征向量融合,最后通过一个全连接的softmax分类层得到关口预测的条件概率。本发明结合海关实际电商数据部分字段丢失以及关键词显著的特点,提出了关键词特征融合模型,有效地提取关键词属性特征以及长程的关键词关系,为解决关口预测问题提供了有效的方法。

Patent Agency Ranking