-
公开(公告)号:CN119992581A
公开(公告)日:2025-05-13
申请号:CN202510067725.0
申请日:2025-01-16
Applicant: 北京工业大学
IPC: G06V30/414 , G06V30/18 , G06V30/186 , G06V30/19 , G06V10/82 , G06N3/0455 , G06N3/042 , G06N3/0464 , G06N3/084
Abstract: 本发明公开了一种基于混合方法的文档布局分析方法,对每一块文本节点进行命名体识别和关系提取属于数字图像处理技术领域。本发明提出一个新颖的通道洗牌的动态范围卷积算法,确保全局的通道特征可以学习到相似像素而非临近像素的特征,并使用适配器以较少的参数量学习文本特征。最终以预测的文本块类别和关系作为结果。最后本发明使用具有挑战性的文档数据集作为验证指标(FUNSD),结果表明提出的方法可以取得明显的性能提升。