一种模型训练的方法以及装置
    1.
    发明公开

    公开(公告)号:CN113011428A

    公开(公告)日:2021-06-22

    申请号:CN202110289276.6

    申请日:2021-03-18

    IPC分类号: G06K9/34 G06K9/32 G06K9/62

    摘要: 本说明书公开了一种模型训练的方法以及装置,获取各待标注图像,针对每个待标注图像,将该待标注图像输入到待训练的文字行识别模型中,得到文字行识别结果,以及将该待标注图像输入到预设的单字识别模型中,得到单字识别结果。而后,根据单字识别结果,对文字行识别结果进行校正,得到校正后文字行识别结果。最后,根据校正后文字行识别结果,对该待标注图像进行标注,得到标注后图像,通过标注后图像,对待训练的文字行识别模型进行模型训练。本方法将单字识别结果和文字行识别结果进行结合,可以有效的提高数据标注的准确性,从而使得文字行识别模型的准确率提高。

    一种训练样本的生成方法及生成装置

    公开(公告)号:CN113011424A

    公开(公告)日:2021-06-22

    申请号:CN202110230635.0

    申请日:2021-03-02

    IPC分类号: G06K9/34 G06K9/32 G06K9/62

    摘要: 本说明书公开了一种训练样本的生成方法及生成装置,获取待标注图像以及待标注图像对应的文本标注信息,并将待标注图像输入到预设的识别模型中,得到针对待标注图像中包含的文本行的整体识别结果,作为第一识别结果,以及针对待标注图像中包含的至少部分单个文字的单字识别结果,作为第二识别结果。而后,根据第一识别结果以及第二识别结果,确定针对待标注图像除文本标注信息外的其他标注信息,作为补充标注信息,根据补充标注信息,对文本标注信息进行补充,得到补充后标注信息,并通过补充后标注信息生成待标注图像对应的训练样本,以通过训练样本对识别模型进行训练,从而有效率地产生训练样本。

    生成模型的方法、装置、可读存储介质及电子设备

    公开(公告)号:CN111898484A

    公开(公告)日:2020-11-06

    申请号:CN202010675753.8

    申请日:2020-07-14

    IPC分类号: G06K9/00 G06K9/62 G06N3/04

    摘要: 本公开涉及一种生成模型的方法、装置、可读存储介质及电子设备。方法包括:获取初始模型的至少一个目标初始网络层各自的初始参数矩阵和压缩比例;针对每一目标初始网络层,根据目标初始网络层的初始参数矩阵和压缩比例,对目标初始网络层进行压缩,以得到样本模型;获取样本数据集;根据样本数据集,对样本模型进行训练,以得到应用在样本数据集所属场景下的目标模型。如此,可以利用取值范围为大于0小于1的压缩比例对目标初始网络层进行压缩,使得压缩后的目标样本网络层中的参数数量小于初始网络层中的参数数量,进而减少了由目标样本网络层构成的样本模型的参数数量,使得目标模型的体积较小,有效地改善了目标模型的性能。

    一种训练模型以及字符检测的方法及装置

    公开(公告)号:CN113205095A

    公开(公告)日:2021-08-03

    申请号:CN202110392490.4

    申请日:2021-04-13

    IPC分类号: G06K9/34 G06K9/62

    摘要: 本说明书公开了一种训练模型以及字符检测的方法及装置。基于合成训练样本对标注模型进行训练,根据训练后的标注模型的输出对真实训练样本进行标注,并根据合成训练样本对字符检测模型进行训练。通过训练后的字符检测模型对待检测的图像进行特征提取,并确定该图像中各字符的包围框以及该图像中的各中心线。以及根据各中心线与各包围框的重叠程度、与同一中心线重叠的各包围框,确定包围框组,并根据各包围框组中各包围框的几何位置特征,对各中心线向周围进行膨胀得到各膨胀包围框,作为该图像的字符检测结果。可通过训练得到的字符检测模型输出准确的包围框以及中心线,以确定出准确的膨胀包围框,作为字符检测结果。

    文档图像方向识别方法、装置及模型的训练方法、装置

    公开(公告)号:CN111325205B

    公开(公告)日:2023-10-10

    申请号:CN202010136041.9

    申请日:2020-03-02

    发明人: 周锴 张睿

    摘要: 本申请公开了文档图像方向识别方法、装置及模型的训练方法、装置。文档图像识别模型的训练方法包括:根据注意力机制,生成训练图像的注意力裁剪图像和注意力抹除图像,以及分别确定训练图像、注意力裁剪图像以及注意力抹除图像各自的注意力融合特征;根据各注意力融合特征分别识别相应图像的方向,得到相应的识别结果;根据各识别结果计算交叉熵损失值,以及根据各注意力融合特征计算中心损失值,根据交叉熵损失值和中心损失值对文档图像方向识别模型进行参数优化或停止训练。利用注意力裁剪和注意力抹除,让文档图像方向识别模型更容易聚焦至文档图像中有区分度的文字部分特征,并且通过减少类内距离,达到了更好的通用文档图像方向判断效果。

    文字检测方法、装置、电子设备和计算机可读存储介质

    公开(公告)号:CN111680691B

    公开(公告)日:2023-06-02

    申请号:CN202010365284.X

    申请日:2020-04-30

    发明人: 王雷 刘曦 张睿

    摘要: 本申请公开了一种文字检测方法、装置、电子设备和计算机可读存储介质,所述方法包括:对待检测图像进行单字检测,得到单字视觉特征和单字位置信息,根据所述单字视觉特征和所述单字位置信息,确定单字连接关系,根据所述单字连接关系确定序列化的文字检测结果。本申请通过借助卷积神经网络的强大特征表征能力,能够自动学习到单字之间的连接关系,避免了复杂的规则设计,提高了文字检测模型的泛化能力,同时将单字检测和单字连接关系的预测统一到一个框架,复用单字检测过程中生成的视觉特征等信息,避免了低效的人工特征选择方式。

    获取信息提取模型、提取文档图像的信息的方法及装置

    公开(公告)号:CN114187601A

    公开(公告)日:2022-03-15

    申请号:CN202111529509.1

    申请日:2021-12-14

    发明人: 周锴 张睿 魏晓林

    摘要: 本申请公开了获取信息提取模型、提取文档图像的信息的方法及装置,属于图像处理技术领域。方法包括:通过初始信息提取模型从用于训练的第一文档图像中获取位置不同的多个第一文本;获取多个第一文本中的各个第一文本的第一特征;基于各个第一文本的第一特征获取各个第一文本的第二特征,任一第一文本的第二特征用于表征任一第一文本的第一特征与其他第一文本的第一特征之间的相关性;基于各个第一文本的第二特征对初始信息提取模型进行训练,得到信息提取模型。由于第二特征可以表征各个第一文本的第一特征之间的相关性,在基于第二特征训练初始信息提取模型时,用小批量的第二特征即可满足训练要求,最终获得的信息提取模型性能好。

    鉴别图像真伪的方法、装置、设备及计算机可读存储介质

    公开(公告)号:CN114140431A

    公开(公告)日:2022-03-04

    申请号:CN202111454061.1

    申请日:2021-12-01

    发明人: 王雷 周锴 张睿

    摘要: 本申请公开了一种鉴别图像真伪的方法、装置、设备及计算机可读存储介质,属于图像处理技术领域。该方法包括:获取待鉴别的图像;提取该图像中的目标区域,统计目标区域中的像素值,根据统计结果得到像素值分布直方图;基于像素值分布直方图,生成像素值分布特征图;对像素值分布特征图进行分类,得到分类结果,基于分类结果确定该图像的真伪结果。本方法通过利用图像中像素值分布特征来鉴别图像的真伪,该方法可以避免使用图像的噪声特征,因而避免图像中的修改区域与未修改区域的噪声特征相同而导致鉴别真伪的准确度低。

    图像增强方法、装置、设备及存储介质

    公开(公告)号:CN113947556A

    公开(公告)日:2022-01-18

    申请号:CN202111151810.3

    申请日:2021-09-29

    IPC分类号: G06T5/50 G06K9/62

    摘要: 本申请公开了一种图像增强方法、装置、设备及存储介质,属于图像处理技术领域。方法包括:获取多组成对样本数据和多组非成对样本数据,每组成对样本数据包括图像内容相同但图像质量不同的两个图像,每组非成对样本数据包括图像内容和图像质量均不同的两个图像,且所述多组非成对样本数据包括多个领域的图像;基于所述多组成对样本数据和所述多组非成对样本数据,对图像增强模型进行训练,得到训练后的所述图像增强模型;在获取到待增强图像的情况下,通过训练后的所述图像增强模型对所述待增强图像进行图像增强,得到增强后的图像。该方案能够使得图像增强模型生成保真度较高的图像,且提高了图像增强模型的泛化能力。

    图像处理方法、装置、计算机设备及存储介质

    公开(公告)号:CN113269730A

    公开(公告)日:2021-08-17

    申请号:CN202110512984.1

    申请日:2021-05-11

    IPC分类号: G06T7/00 G06N3/04 G06N3/08

    摘要: 本申请提供了一种图像处理方法、装置、计算机设备及存储介质,属于计算机技术领域。所述方法包括:基于图像中的第一候选区域的第一图像特征,确定第一注意力特征,所述第一注意力特征用于表示所述第一图像特征中的不同子特征对于确定篡改区域的重要程度;基于所述第一注意力特征和所述第一候选区域,确定所述图像中的第二候选区域;基于所述第二候选区域的第二图像特征和所述第二候选区域,确定所述图像中的目标区域,所述目标区域用于指示篡改区域。本申请通过确定注意力特征,使确定篡改区域的过程中需要重点关注的特征更加突出,进而基于注意力特征通过逐级递进的区域调整,得到篡改区域,提高了篡改区域定位的准确性。