文本处理方法以及装置
    12.
    发明公开

    公开(公告)号:CN116483965A

    公开(公告)日:2023-07-25

    申请号:CN202310401259.6

    申请日:2023-04-14

    Abstract: 本说明书实施例提供文本处理方法以及装置,其中所述文本处理方法包括:根据目标事件对应的业务文本生成文本片段,并将所述文本片段输入至文本处理模型,其中,所述文本处理模型包括初始化单元、提取单元、交换单元以及处理单元;针对所述文本片段添加标识信息,并通过所述初始化单元对添加所述标识信息的文本片段进行初始化处理,获得中间片段特征;通过所述提取单元提取所述中间片段特征的目标特征,并通过所述交换单元对所述目标特征中的目标标识信息进行信息交换处理,根据处理结果确定目标片段特征;通过所述处理单元对所述目标片段特征进行处理,获得所述目标事件的事件决策信息。

    表格识别重构方法、装置、设备、介质及程序产品

    公开(公告)号:CN114926852A

    公开(公告)日:2022-08-19

    申请号:CN202210264155.0

    申请日:2022-03-17

    Inventor: 夏伯谦 王洪彬

    Abstract: 本说明书实施例公开了一种表格识别重构方法、装置、设备、介质及程序产品。其中,该方法包括:通过根据包括表格的目标图像进行文字识别得到的上述目标图像中的目标文本以及上述目标文本中每个目标文字在上述目标图像中对应的位置,以及上述目标图像中的表格进行直线检测得到的至少四条目标线段以及每条上述目标线段对应的位置,重构上述目标图像中的表格。

    图片识别方法及装置
    16.
    发明授权

    公开(公告)号:CN114529993B

    公开(公告)日:2024-09-24

    申请号:CN202210181146.5

    申请日:2022-02-25

    Abstract: 本说明书实施例提供图片识别方法及系统,其中所述图片识别方法包括:将待识别图片输入预先训练的图片识别模型,其中,所述图片识别模型基于有标签图片样本以及满足预设规则的无标签图片样本训练获得;获取所述图片识别模型对所述待识别图片的识别结果,基于所述识别结果确定所述待识别图片是否为风险图片。该方法通过基于有标签图片样本以及满足预设规则的无标签图片样本训练获得的图片识别模型,识别输入的待识别图片是否为风险图片,从而提高了风险图片的识别效率,降低了图片验证过程的难度。

    文档图像的处理方法及装置

    公开(公告)号:CN118522018A

    公开(公告)日:2024-08-20

    申请号:CN202410961302.9

    申请日:2024-07-17

    Abstract: 本说明书实施例提供了文档图像的处理方法及装置,其中,一种文档图像的处理方法包括:在文档图像的解析过程中,一方面对文档图像中的图像块进行特征提取获得图像特征,基于虚拟文本特征与图像特征进行注意力计算并根据获得的注意力权重和图像特征计算注意力图像特征,另一方面对文档图像的解析任务文本进行特征提取获得文本特征,将两方面获得的文本特征与注意力图像特征进行拼接获得拼接特征并输入大模型,由大模型的处理模块按照文本特征对注意力图像特征进行图像解析处理获得图像解析结果,以此在多模态特征拼接的基础上实现文档图像的解析。

    图像识别模型的训练方法及装置、图像识别方法及装置

    公开(公告)号:CN116503876A

    公开(公告)日:2023-07-28

    申请号:CN202310464514.1

    申请日:2023-04-24

    Abstract: 本说明书实施例提供图像识别模型的训练方法及装置、图像识别方法及装置,其中所述图像识别模型的训练方法包括:获取样本文本图像和样本文本图像的样本文本标签;通过图像识别模型确定样本文本图像对应视觉维度的第一全局特征,以及通过文本识别模型确定样本文本标签对应语言维度的第二全局特征;根据第一全局特征和第二全局特征对图像识别模型进行迭代训练,直至获得满足模型训练结束条件的目标图像识别模型;其中,目标图像识别模型的识别结果融合视觉维度和语言维度分别对应的语义特征。在训练阶段基于第一全局特征和第二全局特征进行迭代训练,使模型具备视觉和语言两种编码能力,提高识别效率和准确率。

Patent Agency Ranking