-
公开(公告)号:CN114494679B
公开(公告)日:2024-12-31
申请号:CN202111504588.0
申请日:2021-12-10
Applicant: 上海精密计量测试研究所
IPC: G06V10/22 , G06F40/279 , G06F40/216
Abstract: 本发明提供了一种双层PDF生成及校对方法和装置,针对OCR引擎识别结果进行二次处理,将识别结果整理成逻辑完整的段落,再以段落为单位,针对段落句子从字粒度和词粒度两方面进行错误检测和错误纠错,最后根据纠错结果进一步生成双层PDF文档。装置主要包括OCR识别引擎、存储模块、段落合成模块、错误检测纠正模块和输出模块。
-
公开(公告)号:CN114494679A
公开(公告)日:2022-05-13
申请号:CN202111504588.0
申请日:2021-12-10
Applicant: 上海精密计量测试研究所
IPC: G06V10/22 , G06F40/279 , G06F40/216
Abstract: 本发明提供了一种双层PDF生成及校对方法和装置,针对OCR引擎识别结果进行二次处理,将识别结果整理成逻辑完整的段落,再以段落为单位,针对段落句子从字粒度和词粒度两方面进行错误检测和错误纠错,最后根据纠错结果进一步生成双层PDF文档。装置主要包括OCR识别引擎、存储模块、段落合成模块、错误检测纠正模块和输出模块。
-