-
公开(公告)号:CN120071376A
公开(公告)日:2025-05-30
申请号:CN202510511974.4
申请日:2025-04-23
Applicant: 北京北大软件工程股份有限公司
IPC: G06V30/42 , G06V30/414 , G06V30/148 , G06V30/19 , G06V10/82 , G06N3/0442 , G06N3/0455
Abstract: 本申请公开了一种档案的数字化处理方法、装置、设备、介质及产品,涉及图像识别技术领域,该方法包括从预先采集的档案图像中确定多个文本块;将所述多个文本块输入至预先训练的排列语言模型,得到所述排列语言模型输出的每个文本块的文字‑位置相关信息;其中,一个文字‑位置相关信息中包括一个文本块中包含的每个文字处于该文本块中不同位置的概率;基于所述文字‑位置相关信息,对每个文本块中的文字位置进行调整,得到每个文本块的文本内容;使用每个文本内容生成与所述档案图像对应的数字档案,本申请可以提升档案数字化处理的效率和准确性。