-
公开(公告)号:CN112818951A
公开(公告)日:2021-05-18
申请号:CN202110265378.4
申请日:2021-03-11
Applicant: 南京大学
IPC: G06K9/00 , G06K9/32 , G06N3/04 , G06N3/08 , G06F40/216
Abstract: 本发明公开了一种票证识别的方法,涉及文本检测、文本识别与信息结构化提取技术领域,解决了现有模型不能有效提取结构化信息的技术问题,其技术方案要点是通过对CTPN网络进行训练得到文本行位置检测模型,从而对票证中的关键信息进行定位,且对各种形式(表格等)的票证具有鲁棒性;通过高频词及其中特定字段文本内容的规则合成数据,扩充了文本识别模型的训练数据,提升了识别模型的准确性;基于卷积神经网络,具有很好的并行性,可以利用高性能的GPU(Graphics Processing Unit,图形处理器)加速计算。
-
公开(公告)号:CN115062776A
公开(公告)日:2022-09-16
申请号:CN202210742542.0
申请日:2022-06-27
Applicant: 中华人民共和国南京海关 , 南京大学
Abstract: 本发明公开了一种海关发票实时识别的模型压缩方法,涉及海关票据文字识别和模型压缩技术领域,解决了票据识别模型复杂且识别精度不高的技术问题,其技术方案要点是构建复杂、高计算量的teacher模型和轻量化、低计算量的student模型;使用票据识别数据对teacher模型进行训练,获取高识别精度模型;根据teacher模型和student模型的网络结构设计基于注意力的自适应知识蒸馏框架;通过基于注意力的自适应知识蒸馏框架将高精度的teacher模型向未训练的student模型进行知识蒸馏;在知识蒸馏的基础上使用票据数据对student模型进行训练,最终获得高精度的、轻量化的、实时的票据识别模型。
-
公开(公告)号:CN112818951B
公开(公告)日:2023-11-21
申请号:CN202110265378.4
申请日:2021-03-11
Applicant: 南京大学
IPC: G06V30/414 , G06V20/30 , G06N3/0499 , G06N3/084 , G06F40/216 , G06N3/0464
-
-