票据识别方法、装置、设备以及存储介质

    公开(公告)号:CN112837466B

    公开(公告)日:2023-04-07

    申请号:CN202011501307.1

    申请日:2020-12-18

    Abstract: 本申请公开了一种票据识别方法、装置、设备以及存储介质,涉及计算机视觉、自然语言处理和深度学习等人工智能技术领域。该方法的一具体实施方式包括:获取票据图像;将票据图像输入预先训练的票据识别模型的特征提取网络层中,得到票据图像的票据关键字段特征图和票据关键字段值特征图;将票据关键字段特征图输入票据识别模型的第一头部网络层中,得到票据关键字段;利用票据识别模型的第二头部网络层对票据关键字段值特征图进行处理,得到票据关键字段值,其中,特征提取网络层分别与第一头部网络层和第二头部网络层连接;基于票据关键字段和票据关键字段值,生成票据图像的结构化信息。

    模型训练、难例识别方法、装置、设备、存储介质及程序

    公开(公告)号:CN115359308A

    公开(公告)日:2022-11-18

    申请号:CN202210354081.X

    申请日:2022-04-06

    Abstract: 本公开提供了模型训练、难例识别方法、装置、设备、存储介质及程序,涉及人工智能领域,尤其涉及深度学习、图像处理、计算机视觉技术领域。具体实现方案为:获取预设目标检测模型及其对应的好例样本图像和难例样本图像;预设目标检测模型包括M个相同的目标检测分支网络;通过预设目标检测模型对好例样本图像和难例样本图像进行处理,得到好例样本图像对应的M个目标检测结果以及难例样本图像对应的M个目标检测结果;根据上述目标检测结果,对预设目标检测模型的模型参数进行更新,以得到难例识别模型;更新的目标为:最大化难例样本图像对应的M个目标检测结果之间的不确定性、以及最小化好例样本图像对应的M个目标检测结果之间的不确定性。

    训练模型的方法、装置、电子设备及存储介质

    公开(公告)号:CN115294349A

    公开(公告)日:2022-11-04

    申请号:CN202210751884.9

    申请日:2022-06-29

    Abstract: 本公开提供了训练模型的方法、装置、电子设备及存储介质,涉及人工智能技术领域,尤其涉及深度学习、图像处理、计算机视觉技术领域,可应用于光学字符识别等场景。具体实现方案为:对原始图像进行掩码处理,得到掩码图像;基于预设模型对掩码图像进行编码处理,得到编码序列;基于编码序列进行图像重建,得到重建图像;基于重建图像及原始图像对预设模型的模型参数进行调整,得到目标模型。

    文档矫正方法、装置、电子设备和存储介质

    公开(公告)号:CN115187995A

    公开(公告)日:2022-10-14

    申请号:CN202210807745.3

    申请日:2022-07-08

    Abstract: 本公开提供了一种文档矫正方法、装置、电子设备和存储介质,涉及人工智能领域,具体涉及深度学习、图像处理和计算机视觉等技术领域,可应用于OCR等场景。文档矫正方法的具体实现方案为:对包括待矫正文档的原始图像进行语义分割,得到边缘像素点;基于边缘像素点,确定第一边缘线;根据矫正后文档对应的图像尺寸,确定目标图像的网格图像;对第一边缘线和网格图像的第二边缘线进行等分处理,分别得到第一边缘线的第一关键点和第二边缘线中与第一关键点对应的第二关键点;以及根据第一关键点和第二关键点之间的对应关系,生成目标图像。

    模型压缩方法、图像处理方法、装置和电子设备

    公开(公告)号:CN114881227A

    公开(公告)日:2022-08-09

    申请号:CN202210520999.7

    申请日:2022-05-13

    Abstract: 本公开提供了一种模型压缩方法、图像处理方法、装置和电子设备,涉及人工智能技术领域,尤其涉及深度学习、图像处理、计算机视觉技术领域。具体实现方案为:基于第一训练样本对初始模型进行训练,得到训练后的第一目标模型,第一目标模型包括N个第一网络层和M个第二网络层;对N个第一网络层进行剪枝,得到N个第三网络层;将第i个第三网络层对应的第i个第一网络层作为老师层,基于第一目标模型对应的第二训练样本,对第i个第三网络层进行蒸馏学习,得到第i个第四网络层;根据N个第四网络层和M个第二网络层,生成第二目标模型。由此,可对第一网络层分别进行剪枝,并对第三网络层分别进行蒸馏学习,提升了模型压缩的性能。

    一种图像处理方法、装置及电子设备

    公开(公告)号:CN114445811A

    公开(公告)日:2022-05-06

    申请号:CN202210113499.1

    申请日:2022-01-30

    Abstract: 本公开提供了一种图像处理方法、装置及电子设备,涉及人工智能技术领域,尤其涉及深度学习、计算机视觉技术领域,可应用于OCR等应用场景。具体实现方案为:将目标样本图像、所述目标样本图像的检测结果输入至预先经过训练的特征提取模型,得到所述特征提取模型输出的所述目标样本图像的目标样本特征;针对每个候选样本图像,将所述候选样本图像和所述候选样本图像的检测结果输入至所述特征提取模型,得到所述特征提取模型输出的所述候选样本图像的候选样本特征;从各所述候选样本图像中选取匹配候选样本图像,作为用于训练目标检测模型的样本图像。可以筛选出能够对目标检测模型定向训练的样本图像,以提高目标检测模型的准确性。

    图像处理模型的训练方法、装置、电子设备及存储介质

    公开(公告)号:CN113361578A

    公开(公告)日:2021-09-07

    申请号:CN202110602898.X

    申请日:2021-05-31

    Abstract: 本公开提出了图像处理模型的训练方法、装置、电子设备及存储介质,涉及人工智能技术领域,尤其涉及计算机视觉和深度学习等技术领域,可应用于图像识别场景下。具体实现方案:获取多个训练数据,并对目标搜索空间内的网络模型集合进行搜索,以得到候选网络模型,候选网络模型包括:多个计算层,并确定与多个计算层分别对应的多个敏感程度值;根据多个敏感程度值处理候选网络模型,以得到待训练网络模型,以及采用多个训练数据训练待训练网络模型,以得到图像处理模型,能够有效地简化图像处理模型的结构,从而有效地提升图像处理模型的训练效率,有效地辅助提升图像处理效果。

    图像处理方法、相关装置及计算机程序产品

    公开(公告)号:CN113255664A

    公开(公告)日:2021-08-13

    申请号:CN202110576183.1

    申请日:2021-05-26

    Abstract: 本公开提供了图像处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品,涉及计算机视觉和深度学习等人工智能技术领域,可应用于图像识别场景下。该方法的一具体实施方式包括:确定待处理图像在不同分辨率下构成待矫正对象的像素点的三维坐标,得到三维预测坐标后,根据该三维预测坐标确定该待矫正对象的表面扭曲参数,最终根据该三维预测坐标和该表面扭曲参数生成该待矫正对象的平面图像。该实施方式基于不同分辨率的待处理图像进行三维坐标预测,以更精准的确定待矫正对象的表面扭曲参数,实现更为精准的图像扭曲矫正,提升图像识别、矫正结果的质量。

    图像处理方法、装置、设备和介质

    公开(公告)号:CN112949415A

    公开(公告)日:2021-06-11

    申请号:CN202110156565.9

    申请日:2021-02-04

    Abstract: 本公开公开了一种图像处理方法、装置、设备和介质,涉及人工智能技术领域,具体涉及计算机视觉、深度学习等技术领域。该图像处理方法包括:获取图像中至少一个文本区域的各个文本区域的多模态特征,所述多模态特征包括多个维度的特征;对所述各个文本区域的多模态特征进行全局注意力处理,以得到所述各个文本区域的全局注意力特征;基于所述各个文本区域的全局注意力特征,确定所述各个文本区域的类别,基于所述各个文本区域的文本内容和所述类别构建结构化信息。本公开可以提供更具有普适性的图像中的结构化信息的构建方案。

Patent Agency Ranking