-
公开(公告)号:CN114283419B
公开(公告)日:2025-01-03
申请号:CN202111616149.9
申请日:2021-12-27
Applicant: 科大讯飞股份有限公司
IPC: G06V30/148 , G06T7/62 , G06T7/11 , G06V10/26 , G06V10/774
Abstract: 本申请公开了一种文本图像区域检测方法、相关设备及可读存储介质。该方案中,在获取待进行区域检测的文本图像之后,对该文本图像中的第一目标进行实例分割处理,得到第一目标的区域检测结果,对该文本图像中的第二目标进行语义分割处理,得到第二目标的区域检测结果,最后基于第一目标的区域检测结果以及第二目标的区域检测结果,确定该文本图像的区域检测结果。该方案中,针对不同的目标,采用不同的方式进行区域检测,避免出现采用一种文本图像区域检测方法无法涵盖各种目标的检测,导致部分目标漏检或错检的问题,因此,能够提升区域检测的准确度。
-
公开(公告)号:CN118334685A
公开(公告)日:2024-07-12
申请号:CN202410515506.X
申请日:2024-04-26
Applicant: 科大讯飞股份有限公司
IPC: G06V30/41 , G06V30/413 , G06V30/18 , G06V30/19 , G06V10/82 , G06N3/0455 , G06N3/08
Abstract: 本发明涉及图像识别技术领域,提供一种文档版面分析方法、装置、电子设备及存储介质,该方法中引入了版面信息单元集合,并从中选取待分析文档图像对应的目标版面信息单元,将其对应的待分析文档图像的版面特征结合待分析文档图像的视觉特征,可以丰富待分析文档图像中各文档要素的特征信息,进而确定待分析文档图像中文档要素像素级别的位置信息,实现待分析文档图像中各文档要素的位置信息的精细化表示,提高各文档要素的位置信息的质量,在弯曲畸变场景仍能保证效果,同时提高了类似复杂场景下的文档版面分析效果。
-
公开(公告)号:CN117765558A
公开(公告)日:2024-03-26
申请号:CN202311738717.1
申请日:2023-12-15
Applicant: 科大讯飞股份有限公司
IPC: G06V30/414 , G06V30/148 , G06V30/18 , G06V30/19 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明提供一种题块区域划分方法、题块区域划分模型的训练方法及装置,其中方法包括:获取待分割的试题图像;对试题图像进行题块区域检测,得到试题图像中的候选题块区域的区域特征和位置特征;基于候选题块区域的区域特征和位置特征,确定候选题块区域之间的关系,并基于候选题块区域之间的关系,从候选题块区域中确定试题图像的题块区域。本发明提供的方法及装置,基于候选题块区域的区域特征和位置特征,确定候选题块区域之间的关系,加强候选题块区域之间的信息交互,学习到整图题型分布,从而确保后续基于候选题块区域之间的关系,从候选题块区域中确定出的试题图像的题块区域是较为独立的题型,进而提高了题块区域划分的准确性和可靠性。
-
公开(公告)号:CN118411733A
公开(公告)日:2024-07-30
申请号:CN202410132276.9
申请日:2024-01-30
Applicant: 科大讯飞股份有限公司
IPC: G06V30/413 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/0442 , G06N3/09 , G06N3/088 , G06N3/084
Abstract: 本申请实施例公开了一种文本识别方法、装置、设备及存储介质,先对图片进行特征提取,得到视觉特征,然后对视觉特征进行处理,得到文本识别结果,该文本识别结果以标记语言表述图片中的文本内容及其版面信息,也就是说,基于本申请生成了更加丰富的文本识别结果,提高了文本识别的智能性。
-
公开(公告)号:CN118334686A
公开(公告)日:2024-07-12
申请号:CN202410515507.4
申请日:2024-04-26
Applicant: 科大讯飞股份有限公司
IPC: G06V30/41 , G06V30/148 , G06V30/19
Abstract: 本发明提供一种文档识别方法、装置、电子设备和存储介质,涉及人工智能技术领域,其中方法包括:获取用户输入的识别需求信息,所述识别需求信息包括至少一个第一待识别要素;针对各所述第一待识别要素,在确定识别模式为精细模式的情况下,基于所述第一待识别要素对待识别文档图片进行要素分割,得到所述第一待识别要素对应的要素分割结果;基于所述要素分割结果生成第一提示信息;从所述待识别文档图片中确定与所述第一提示信息对应的第一待识别要素信息;基于所述第一提示信息对所述第一待识别要素信息进行识别,得到第一识别结果。本发明实现了文档图片的个性化识别,且降低了识别结果的序列长度。
-
公开(公告)号:CN114283419A
公开(公告)日:2022-04-05
申请号:CN202111616149.9
申请日:2021-12-27
Applicant: 科大讯飞股份有限公司
IPC: G06V30/148 , G06T7/62 , G06T7/11 , G06V10/26 , G06V10/774
Abstract: 本申请公开了一种文本图像区域检测方法、相关设备及可读存储介质。该方案中,在获取待进行区域检测的文本图像之后,对该文本图像中的第一目标进行实例分割处理,得到第一目标的区域检测结果,对该文本图像中的第二目标进行语义分割处理,得到第二目标的区域检测结果,最后基于第一目标的区域检测结果以及第二目标的区域检测结果,确定该文本图像的区域检测结果。该方案中,针对不同的目标,采用不同的方式进行区域检测,避免出现采用一种文本图像区域检测方法无法涵盖各种目标的检测,导致部分目标漏检或错检的问题,因此,能够提升区域检测的准确度。
-
-
-
-
-