文本提取方法及装置

    公开(公告)号:CN118982839A

    公开(公告)日:2024-11-19

    申请号:CN202411103257.X

    申请日:2024-08-12

    发明人: 汪洲

    摘要: 本申请提供文本提取方法及装置,其中所述文本提取方法包括:获取待识别文档,其中,所述待识别文档中包括至少一个文本块;识别所述待识别文档中每个文本块的位置信息;根据每个文本块的位置信息,从所述待识别文档中提取每个文本块对应的目标子文本;根据每个文本块对应的目标子文本和每个文本块的位置信息,获得所述待识别文档对应的目标文本。通过本申请提供的方法,能有效解决在文本提取过程中出现的因特殊格式等原因导致文本行与行之间乱序的问题,更清楚准确的提取文档中的内容。

    用于文件扫描矫正的智能控制处理方法及系统

    公开(公告)号:CN118972501A

    公开(公告)日:2024-11-15

    申请号:CN202411435653.2

    申请日:2024-10-15

    摘要: 本发明公开了用于文件扫描矫正的智能控制处理方法及系统,涉及图像处理技术领域,包括:获取文件扫描图像进行边缘检测,提取文档的外轮廓,确定文档边界;基于文档边界对文件扫描图像内部进行直线边界检测,分割多类型文档区域;根据文档边界及多类型文档区域,进行多层次特征提取与融合,获得识别特征;进行页面变化识别,生成页面补偿参数;根据页面补偿参数解析文件扫描设备的补偿控制参数,补偿控制参数用于对文件扫描设备进行固定托盘位置、压力调整。本发明解决现有技术在进行文件扫描时存在适用性有限、自动化程度低的技术问题,实现对多类型文件的适应性以及自动校正,达到提高扫描图像的质量和处理效率的技术效果。

    定位识别方法、装置、电子设备和存储介质

    公开(公告)号:CN118968534A

    公开(公告)日:2024-11-15

    申请号:CN202410645406.9

    申请日:2024-05-23

    摘要: 本申请涉及一种定位识别方法,将模板答题卡图像和学生答题卡图像分别输入第一深度学习模型,得到模板答题卡目标区域图像和学生答题卡目标区域图像,将得到的目标区域图像分别输入第二深度学习模型,得到模板答题卡和学生答题卡各自的目标评分区域图像,将学生答题卡目标评分区域图像的坐标集合记为第一集合,根据模板答题卡图像的定位坐标信息对学生答题卡图像进行处理,使模板答题卡图像和学生答题卡图像在同一坐标系下一一映射,根据模板答题卡目标评分区域图像的坐标集合对学生答题卡图像进行裁剪,得到第二集合,采用预设算法对第一集合和第二集合进行处理,得到目标坐标集合,根据目标坐标集合进行图像分类识别,提高机器阅卷的准确率。

    基于答题卡的客观题批阅方法、装置、设备及存储介质

    公开(公告)号:CN113033480B

    公开(公告)日:2024-11-05

    申请号:CN202110422319.3

    申请日:2021-04-20

    发明人: 常治国

    摘要: 本发明涉及数据处理领域,提供了基于答题卡的客观题批阅方法、装置、设备及存储介质。该方法包括:拍摄作答完成的答题卡以获取其数字图像;基于数字图像获取水平线段对应的离散曲线和竖直线段对应的离散曲线;根据水平离散曲线和竖直离散曲线从数字图像中定位网格单元;从定位的各网格单元中获取各题目的手写作答内容;对手写作答内容进行识别得到各题目的识别结果;将各题目的识别结果与预先设定的标准答案进行一一比对,以获取各题目的批阅结果。本发明通过离散曲线进行网格单元定位,当答题卡发生曲翘等变形时,相比传统的直线检测算法更为精准,相比基于深度学习的算法,算力需求更小,更适用于课堂实时测验等基于边缘计算的实时应用场景。

    一种图框属性提取方法、系统及装置

    公开(公告)号:CN118887695A

    公开(公告)日:2024-11-01

    申请号:CN202411259768.0

    申请日:2024-09-10

    发明人: 张伟 杨连锐

    摘要: 本说明书实施例提供一种图框属性提取方法、系统及装置,其中,该方法包括获取图框属性的标准信息,所述标准信息包括多个标准图框属性和每个所述标准图框属性的标准特征值以及标准特征值依存关系;解析目标图纸,获取目标图框和所述目标图框范围内的多个文本;确定所述多个文本中每个文本的特征值和特征值依存关系;基于所述特征值、所述特征值依存关系和所述标准信息确定所述目标图框对应的目标图框属性;基于此,提取的图框属性准确度高,具有较好的图纸管理效果;此外,不需要依赖规范化的图框和文本格式,对非标准的图纸也能较好地提取其中的图框属性,具有较好的泛用性。

    一种基于BERT增强的ES检索知识库方法

    公开(公告)号:CN118885565A

    公开(公告)日:2024-11-01

    申请号:CN202410917335.3

    申请日:2024-07-10

    摘要: 本发明属于自然语言处理技术领域,尤其为一种基于BERT增强的ES检索知识库方法,包括如下步骤:S1:用户咨询输入:用户在系统中通过用户咨询模块提交查询请求,系统接收到查询请求后,首先调用权限查询模块,权限查询模块会对用户的身份进行验证,包括用户的角色、权限级别等,根据用户的权限级别,判断用户是否有权访问所查询的内容和访问相应的知识库。本发明利用BERT的语义理解能力,能够更准确地理解用户查询意图,从而提高检索结果的质量和相关性,BERT能够处理更加复杂和长文本,能够检索和理解更广泛的知识库内容,包括长文档、技术文档、新闻报道等,由于检索结果更加精确和相关,用户能够更快速地找到所需信息,提升了用户的检索体验和满意度。

    文档识别方法、装置、设备、存储介质及程序产品

    公开(公告)号:CN118865424A

    公开(公告)日:2024-10-29

    申请号:CN202410894080.3

    申请日:2024-07-04

    摘要: 本申请公开了一种文档识别方法、装置、设备、存储介质及程序产品,涉及图像处理技术领域,公开的文档识别方法,包括:获取待识别文档图像;利用目标检测模型,提取待识别文档图像中文档元素的第一布局信息和/或表格元素的第二布局信息;根据第一布局信息和/或第二布局信息,对待识别文档图像进行区域划分,获得至少一个元素分区;从至少一个元素分区中,识别待识别文档图像中的文字内容。本申请解决了文档识别方法基于预定义的解析规则和模板来匹配文档元素,准确性低的技术问题,提高了文档识别方法的准确性。

    一种行程单信息的识别方法和装置

    公开(公告)号:CN118823813A

    公开(公告)日:2024-10-22

    申请号:CN202310414343.1

    申请日:2023-04-18

    发明人: 刘海波 杜新宇

    摘要: 本发明公开了一种行程单信息的识别方法和装置,涉及大数据技术领域。该方法的具体实施方式包括:接收一张或多张行程单图像;对行程单图像进行文本识别,得到行程单图像中的多个文本片段;将多个文本片段分别与预生成的行程单模板中的行标签或者列标签进行对比,匹配行程单图像的目标行程单模板;其中,目标行程单模板包括待提取标签;根据待提取标签,提取行程单图像中对应的属性值,将属性值与待提取标签的赋值变量组合,得到行程单信息。该实施方式能够将图像识别和预先构建的不同类型的配置化模板相结合,以准确识别行程单中的行程单信息,降低人力成本和训练成本,防止行程单识别的长尾效应,提高识别效率和识别准确度。