-
公开(公告)号:CN109460745A
公开(公告)日:2019-03-12
申请号:CN201811469354.5
申请日:2018-11-28
Applicant: 科大讯飞股份有限公司
Inventor: 张银田
CPC classification number: G06K9/00463 , G06K9/4604
Abstract: 本申请提供了一种直线滤除方法、装置、设备及存储介质,其中,方法包括:从目标图像中获取包括多条直线段的至少一个目标直线段集合;对多条直线段进行配对,获得配对直线段组,一个配对直线段组包括一目标直线段和目标直线段的配对直线段,一个配对直线段组对应目标图像中的一待滤除直线段;基于配对直线段组,确定配对直线段组所对应的待滤除直线段的线宽;基于待滤除直线段的线宽,将目标图像中的待滤除直线段滤除。本申请可动态估计待滤除直线段的线宽并基于该线宽对待滤除直线段进行滤除,本申请不但适用于分布均匀、粗细一致的直线段的滤除,而且适用于分布不规律、粗细不一致的直线段的滤除,适用范围较广且滤除效果较好。
-
公开(公告)号:CN104268603B
公开(公告)日:2017-04-12
申请号:CN201410472818.3
申请日:2014-09-16
Applicant: 科大讯飞股份有限公司
CPC classification number: G06K9/6878 , G06K9/342 , G06K9/6807 , G06K9/72 , G06K2209/01 , G06K2209/013
Abstract: 本发明公开了一种用于文字性客观题的智能阅卷方法及系统,该方法包括:获取文字性客观题答案图像;对所述答案图像进行切分,获得待识别答案字符串的一个或多个切分结果;判断是否有字数与标准答案字数相同的切分结果;如果没有,则确定答案错误;否则,计算所述字数与标准答案字数相同的切分结果的识别置信度,和/或计算所述字数与标准答案字数相同的切分结果中各字符的识别置信度;根据计算得到的识别置信度确定答案是否正确。利用本发明,可以实现文字性客观题的自动阅卷,减少人力资源消耗,提高阅卷效率及准确性。
-
公开(公告)号:CN114283419B
公开(公告)日:2025-01-03
申请号:CN202111616149.9
申请日:2021-12-27
Applicant: 科大讯飞股份有限公司
IPC: G06V30/148 , G06T7/62 , G06T7/11 , G06V10/26 , G06V10/774
Abstract: 本申请公开了一种文本图像区域检测方法、相关设备及可读存储介质。该方案中,在获取待进行区域检测的文本图像之后,对该文本图像中的第一目标进行实例分割处理,得到第一目标的区域检测结果,对该文本图像中的第二目标进行语义分割处理,得到第二目标的区域检测结果,最后基于第一目标的区域检测结果以及第二目标的区域检测结果,确定该文本图像的区域检测结果。该方案中,针对不同的目标,采用不同的方式进行区域检测,避免出现采用一种文本图像区域检测方法无法涵盖各种目标的检测,导致部分目标漏检或错检的问题,因此,能够提升区域检测的准确度。
-
公开(公告)号:CN117765558A
公开(公告)日:2024-03-26
申请号:CN202311738717.1
申请日:2023-12-15
Applicant: 科大讯飞股份有限公司
IPC: G06V30/414 , G06V30/148 , G06V30/18 , G06V30/19 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明提供一种题块区域划分方法、题块区域划分模型的训练方法及装置,其中方法包括:获取待分割的试题图像;对试题图像进行题块区域检测,得到试题图像中的候选题块区域的区域特征和位置特征;基于候选题块区域的区域特征和位置特征,确定候选题块区域之间的关系,并基于候选题块区域之间的关系,从候选题块区域中确定试题图像的题块区域。本发明提供的方法及装置,基于候选题块区域的区域特征和位置特征,确定候选题块区域之间的关系,加强候选题块区域之间的信息交互,学习到整图题型分布,从而确保后续基于候选题块区域之间的关系,从候选题块区域中确定出的试题图像的题块区域是较为独立的题型,进而提高了题块区域划分的准确性和可靠性。
-
公开(公告)号:CN117237969A
公开(公告)日:2023-12-15
申请号:CN202311056254.0
申请日:2023-08-21
Applicant: 科大讯飞股份有限公司
IPC: G06V30/412 , G06V30/19 , G06V10/774 , G06V10/82
Abstract: 本申请公开了一种批改方法、装置、设备及可读存储介质。在确定待批改题目之后,先调用大模型,将待批改题目的题干输入大模型,以使大模型生成待批改题目的作答结果;再基于大模型生成的待批改题目的作答结果确定待批改题目的正确答案;通过将用户作答的答案与待批改题目的正确答案进行对比,即可得到待批改题目的批改结果。基于本方案,无需依赖题库资源,利用大模型强大的语言理解能力和文本生成能力即可实现高效、准确的批改。
-
公开(公告)号:CN116612462A
公开(公告)日:2023-08-18
申请号:CN202310432308.2
申请日:2023-04-18
Applicant: 科大讯飞股份有限公司
IPC: G06V20/60 , G06V10/82 , G06V10/774 , G06N3/0464 , G06N3/0475 , G06N3/045 , G06N3/096
Abstract: 本申请提供了一种图像检测方法、装置、设备及存储介质,具体实现方案为:获取特定场景下的待检测图像;基于预设的图像检测模型对所述待检测图像进行检测,得到所述待检测图像中的异物;其中,所述异物用于表示与所述待检测图像中的目标物体所不同的物体;所述图像检测模型是由在所述特定场景下基于不同种类的异物所生成的合成图像训练数据进行图像异物检测训练得到的。根据本申请的技术方案,能够有效提升异物检测的准确率。
-
公开(公告)号:CN116363653A
公开(公告)日:2023-06-30
申请号:CN202310153166.6
申请日:2023-02-17
Applicant: 科大讯飞股份有限公司
IPC: G06V30/146 , G06V30/19
Abstract: 本发明公开了一种文档要素检测方法、装置、设备和介质,检测方法包括:获取待测文档图像;利用检测模型对待测文档图像进行检测,得到待测文档图像中文档要素的目标区域;其中,检测模型经第一训练、第二训练中的至少一者得到,且在第一训练的过程中,至少基于样本文档图像中样本文档要素的要素语义特征和要素图像特征之间的差异进行训练,在第二训练的过程中,基于样本文档图像中样本文档要素的标注区域和经检测模型预测的预测区域之间的差异进行训练,预测区域至少基于样本文档图像的样本语义特征和样本图像特征预测得到。通过上述方式,能够提高文档要素检测的准确性。
-
公开(公告)号:CN116129322A
公开(公告)日:2023-05-16
申请号:CN202310130324.6
申请日:2023-02-07
Applicant: 科大讯飞股份有限公司
Abstract: 本发明提供一种视频检测方法、装置、电子设备和存储介质,方法包括:对待检测视频进行翻页动作检测,得到待检测视频中处于非翻页动作下的各页面的图像序列;基于图像序列中各图像的视觉特征和频域特征,以及各图像中识别文本的语义特征,从各图像中确定出页面的代表图像;基于各页面的代表图像,进行图像处理。本发明提供的方法、装置、电子设备和存储介质,针对翻页动作检测所得的各页面的图像序列,从各图像中确定出页面的代表图像,基于代表图像进行图像处理,实现了全自动流程下的翻页检测,能够适配大量翻页动作的检测场景,并确保各页面的代表图像选择的可靠性和合理性,进而保证了对待检测视频所包含的页面内容进行图像处理的可靠性。
-
公开(公告)号:CN115222935A
公开(公告)日:2022-10-21
申请号:CN202210716572.4
申请日:2022-06-22
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提出一种图像校正方法、装置、电子设备、扫描笔及存储介质,方法包括:获取扫描设备扫描得到待校正图像时的设备姿态参数,作为目标姿态参数;根据预先存储的设备姿态参数与图像变换信息的匹配信息,确定与目标姿态参数对应的目标图像变换信息;利用目标图像变换信息,对待校正图像进行校正。采用本申请的技术方案,预先记录了扫描设备在各种设备姿态参数下采集的图像的图像变换信息,可以直接根据采集待校正图像时的姿态参数,确定对待校正图像校正的目标图像变换信息,无需根据待校正图像中的图像内容计算图像变换信息,提高了图像变换的准确性,从而提高了图像校正的准确率。
-
公开(公告)号:CN114330234A
公开(公告)日:2022-04-12
申请号:CN202111656131.1
申请日:2021-12-30
Applicant: 科大讯飞股份有限公司
IPC: G06F40/106 , G06T7/70 , G06V30/148 , G06V30/413 , G06F16/35
Abstract: 本发明提供一种版面结构分析方法、装置、电子设备和存储介质,其中方法包括:提取待分析的版面图像的图像特征;基于所述图像特征,对所述版面图像进行版面要素检测,得到所述版面图像中各要素的位置信息和要素类别;基于所述图像特征,对所述版面图像进行文本行分割,得到所述版面图像中各文本行的位置信息;基于所述版面图像中各要素的位置信息和要素类别,以及各文本行的位置信息,对所述版面图像进行版面结构分析。本发明提供的版面结构分析方法、装置、电子设备和存储介质,能够同时对版面图像的逻辑结构和布局结构进行全面、准确的分析,特别是针对版面结构复杂场景下的版面结构分析。
-
-
-
-
-
-
-
-
-