-
公开(公告)号:CN119964185A
公开(公告)日:2025-05-09
申请号:CN202510130859.2
申请日:2025-02-05
Applicant: 中国电信股份有限公司
IPC: G06V30/413 , G06V30/18 , G06V30/414 , G06V30/412
Abstract: 本申请公开了一种文档数字化处理方法、装置及非易失性存储介质。其中,该方法包括:在目标文档图像中确定待处理区域,其中,待处理区域的区域类型包括文本区域和表格区域;采用文档数字化处理模型中的编码器提取待处理区域的区域视觉特征;采用文档数字化处理模型中的第一解码器对区域视觉特征进行处理,得到待处理区域的空间布局信息和区域内容信息;采用文档数字化处理模型中的第二解码器对区域视觉特征进行处理,得到待处理区域的结构信息;依据各个待处理区域的空间布局信息、区域内容信息和结构信息,得到与目标文档图像对应的数字化文档。本申请解决了由于相关技术中无法对文档的表格部分进行准确识别导致的文档数字化效果较差的技术问题。