特征融合方法、装置、电子设备及计算机可读存储介质

    公开(公告)号:CN115601620B

    公开(公告)日:2024-11-12

    申请号:CN202211304730.1

    申请日:2022-10-24

    Abstract: 本公开提供了特征融合方法、装置、电子设备及计算机可读存储介质,涉及人工智能技术领域,具体涉及深度学习、图像处理、大模型、计算机视觉技术领域,可应用于光学字符识别等场景。具体实现方案为:获取第一输入特征以及第二输入特征,第一输入特征以及第二输入特征均与目标分析对象的相关性满足预设的相关性条件;将第一输入特征以及第二输入特征输入预置的特征融合网络,得到第一交叉注意力特征以及第二交叉注意力特征。基于本方案提供的特征融合网络对第一输入特征以及第二输入特征进行特征融合处理,得到融合有第一输入特征的特性以及第二输入特征的特性的第一交叉注意力特征以及第二交叉注意力特征,能够提升特征融合的效果。

    信息抽取方法及装置、电子设备和存储介质

    公开(公告)号:CN116110056B

    公开(公告)日:2023-09-26

    申请号:CN202211710611.6

    申请日:2022-12-29

    Abstract: 本公开公开了一种信息抽取方法及装置、电子设备和存储介质,涉及计算机技术领域,尤其涉及图像处理领域。具体实现方案为:获取文档图像对应的视觉文本特征;采用单元压缩Transformers网络对所述视觉文本特征进行编码,得到处理后的特征,以使任一层Transformer的输入特征长度与输出特征长度相同;根据所述视觉文本特征对应的结构信息,对所述处理后的特征进行信息抽取,获取所述文档图像对应的信息抽取结果。采用上述方案的本公开可以降低模型计算量的同时提高信息抽取的准确性。

    信息生成方法、信息处理方法、装置、电子设备以及介质

    公开(公告)号:CN116311298A

    公开(公告)日:2023-06-23

    申请号:CN202310023539.8

    申请日:2023-01-06

    Abstract: 本公开提供了一种信息生成方法、信息处理方法、装置、电子设备以及介质,涉及人工智能技术领域,尤其涉及深度学习技术、图像处理技术和计算机视觉技术领域,可应用于OCR光学字符识别等场景。具体实现方案为:对文本图像进行文本检测,得到检测信息,检测信息包括多个文本区域各自的类别信息和位置信息;根据位置信息和文本图像,获取与多个文本区域各自对应的文本区域图像;对文本区域图像进行文本识别,得到识别信息,识别信息包括多个文本区域图像各自的文本识别信息;根据识别信息,确定语义关系信息,语义关系信息包括多个文本识别信息之间的语义关系;根据类别信息、语义关系信息和识别信息,生成文本图像的结构化信息。

    训练模型的方法、装置、电子设备及存储介质

    公开(公告)号:CN115294349B

    公开(公告)日:2023-06-02

    申请号:CN202210751884.9

    申请日:2022-06-29

    Abstract: 本公开提供了训练模型的方法、装置、电子设备及存储介质,涉及人工智能技术领域,尤其涉及深度学习、图像处理、计算机视觉技术领域,可应用于光学字符识别等场景。具体实现方案为:对原始图像进行掩码处理,得到掩码图像;基于预设模型对掩码图像进行编码处理,得到编码序列;基于编码序列进行图像重建,得到重建图像;基于重建图像及原始图像对预设模型的模型参数进行调整,得到目标模型。

    信息处理方法、装置、设备、介质和程序产品

    公开(公告)号:CN116152817A

    公开(公告)日:2023-05-23

    申请号:CN202211742761.5

    申请日:2022-12-30

    Abstract: 本公开提供了一种信息处理方法、装置、设备、介质和程序产品,涉及人工智能技术领域,具体为深度学习、图像处理和计算机视觉技术领域,可应用于OCR等场景。在本公开的一些实施例中,获取原始文本图像以及原始文本图像对应的原始文本;分别对原始文本和原始文本图像进行编码处理,得到文本特征和图像特征;将文本特征和图像特征输入至少一个特征交互神经网络层中,得到文本类别特征和图像类别特征;特征交互神经网络层用于对文本特征和图像特征中提取到的特征进行交叉合并处理,通过对神经网络结构进行优化,降低计算量;融合文本特征和图像特征,确定原始文本包含的实体的类型,提升实体类型识别的准确率。

    信息生成方法、信息处理方法、装置、电子设备以及介质

    公开(公告)号:CN115984888A

    公开(公告)日:2023-04-18

    申请号:CN202310023575.4

    申请日:2023-01-06

    Abstract: 本公开提供了一种信息生成方法、信息处理方法、装置、电子设备以及介质,涉及人工智能技术领域,尤其涉及深度学习技术、图像处理技术和计算机视觉技术领域,可应用于OCR光学字符识别等场景。具体实现方案为:对文本图像进行文本检测,得到检测信息,其中,检测信息包括第一检测信息和第二检测信息,第一检测信息包括多个第一文本区域各自的类别信息和第一位置信息,第二检测信息包括至少一个第二文本区域各自的第二位置信息;根据第一位置信息和文本图像,获取与多个第一文本区域各自对应的文本区域图像;对文本区域图像进行文本识别,得到识别信息;根据类别信息、第二检测信息和识别信息,生成文本图像的结构化信息。

    关键信息抽取方法、模型训练方法、相关装置及电子设备

    公开(公告)号:CN114818708B

    公开(公告)日:2023-04-18

    申请号:CN202210419183.5

    申请日:2022-04-20

    Abstract: 本公开提供了一种关键信息抽取方法、模型训练方法、相关装置及电子设备,涉及人工智能技术领域,具体涉及深度学习、图像处理、计算机视觉技术领域。具体实现方案为:对第一图像进行特征处理,得到所述第一图像中第一文档的第一语义特征,所述第一语义特征是对所述第一图像的第一图像特征进行语义编码得到的,所述第一文档包括文本行;截取所述第一语义特征中所述文本行的区域特征进行解码,得到所述文本行的第一识别信息,所述第一识别信息包括所述文本行的第一文本序列和所述第一文本序列中各文本单元的第一类别标记;从所述第一文本序列中抽取关键信息,所述关键信息包括所述第一文本序列中第一类别标记表征为命名实体的文本单元。

Patent Agency Ranking