-
公开(公告)号:CN118230334A
公开(公告)日:2024-06-21
申请号:CN202410140968.8
申请日:2024-01-31
Applicant: 科大讯飞股份有限公司
IPC: G06V30/19 , G06V30/14 , G06V30/414 , G06V10/82 , G06F16/22 , G06N3/0464 , G06N3/08
Abstract: 本申请提出一种题库资源加工方法、装置、电子设备、存储介质及产品,该方法包括:对试题图像进行版面要素检测,确定试题图像对应的版面要素信息;版面要素信息包括:版面要素的类型、位置和内容;基于试题图像对应的版面要素信息和预先设置的阅读顺序,确定试题集合;试题集合中包括按照阅读顺序排序的试题题干和试题解答;基于试题集合中各个试题题干对应的版面要素信息和试题集合中各个试题解答对应的版面要素信息,确定各个试题题干与各个试题解答之间的匹配结果。采用本方案,能够对试题图像中的各个试题题干和试题解答进行自动匹配,提高了试题题干与试题解答之间的匹配效率,从而提高了题库资源的加工效率,减少了题库资源的加工成本。
-
公开(公告)号:CN115174814B
公开(公告)日:2024-06-04
申请号:CN202210908066.5
申请日:2022-07-29
Applicant: 科大讯飞股份有限公司
IPC: H04N23/67
Abstract: 本申请公开了一种对焦纸面及作业学情采集方法、装置、设备及存储介质,本申请获取到对包含指定用户的手写体批注内容的纸质文档拍摄的图片,从中识别出手写体批注内容对应的目标区域,控制摄像头在不同焦距下对目标区域进行拍摄,分别确定每一焦距对应的目标区域图片中手写体批注内容的清晰度,并选取清晰度最高的焦距作为目标焦距,以便摄像头基于目标焦距进行后续的拍摄。本申请中考虑到对于作业学情采集这一任务,指定用户的手写体批注内容是最重要的信息,以不同焦距下拍摄的手写体批注内容的清晰度作为筛选条件确定目标焦距,保证按照该目标焦距拍摄的图片中指定用户的手写体批注内容是清晰的,提升后续对作业学情的采集的准确度。
-
公开(公告)号:CN112733855B
公开(公告)日:2024-04-09
申请号:CN202011615053.6
申请日:2020-12-30
Applicant: 科大讯飞股份有限公司
IPC: G06V30/148 , G06V30/18 , G06V30/146 , G06T7/13 , G06T7/187
Abstract: 本申请公开了一种表格结构化方法、表格恢复系统以及具有存储功能的装置。本申请的表格结构化方法充分利用深度学习方案得到单元格的位置信息和文字信息,准确挖掘表格线和单元格定点位置信息,从而获得准确的表格结构化。
-
公开(公告)号:CN117725168A
公开(公告)日:2024-03-19
申请号:CN202311381504.8
申请日:2023-10-23
Applicant: 科大讯飞股份有限公司
IPC: G06F16/332 , G06V20/62 , G06T9/00
Abstract: 本申请公开了一种开放式问答方法、装置及相关设备,多模态大模型包括图像编码模块和大语言模型,在回答与目标图像相关的问题文本时,可以调用文本识别算法对目标图像进行文本识别,得到文本识别结果,可以通过大语言模型得到该文本识别结果的特征表示,进一步,大语言模型在解码答案文本时其输入除了包含传统的问题文本的特征表示及训练图像的特征表示之外,额外增加了对目标图像的文本识别结果的特征表示,使得大语言模型可以关注到目标图像中文本内容及其位置信息,如此可以使得多模态大模型具备文字空间感知能力,因而在回答与文字空间排布相关问题时能够基于掌握的对文字的空间感知能力准确给出正确回答。
-
公开(公告)号:CN115565189A
公开(公告)日:2023-01-03
申请号:CN202211353860.4
申请日:2022-10-31
Applicant: 科大讯飞股份有限公司
IPC: G06V30/32 , G06V30/14 , G06V30/148 , G06V30/19
Abstract: 本申请提出一种扫描图像识别方法、装置、电子设备及存储介质,方法包括:从采集的扫描图像中,确定有效边界图像帧;确定有效边界图像帧中的边界字符是否为有效字符,若为有效字符,则从目标图像中确定边界字符的第一字符边界作为切分位置;若为无效字符,则从目标图像中确定边界字符的第二字符边界作为切分位置;对按照切分位置从目标图像中切分得到的待识别图像进行字符识别,得到扫描结果。第一字符边界使得从目标图像中切分得到的待识别图像中包含边界字符,以避免有效字符漏扫,第二字符边界使得从目标图像中切分得到的待识别图像中不包含边界字符,以避免无效字符多扫,提高了扫描图像的准确度,继而提高了识别结果的准确率。
-
公开(公告)号:CN115240197A
公开(公告)日:2022-10-25
申请号:CN202210716574.3
申请日:2022-06-22
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提出一种图像质量评价方法、装置、电子设备、扫描笔及存储介质,方法包括:检测获取的图像帧的对比度,以及从图像帧中检测字符和黑色图像区域;若检测到图像帧的对比度低于预设的对比度阈值、图像帧中不存在字符,以及图像帧中存在周期性黑色图像区域中的任意一种情况发生,则确定图像帧的图像质量不合格。采用本申请的技术方案,可以对采集到的图像帧进行图像质量评价,从而判定该图像帧的有效性,避免图像帧的图像质量对图像识别效果和准确率的影响。
-
公开(公告)号:CN114359322A
公开(公告)日:2022-04-15
申请号:CN202111660855.3
申请日:2021-12-31
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种图像校正、拼接方法及相关装置、设备、系统和存储介质,其中,图像校正方法包括:确定至少两帧原始图像中的连通域,其中,所述至少两帧原始图像是拍摄设备扫描得到的;基于所述至少两帧原始图像中的连通域,确定所述至少两帧原始图像的视场,其中,所述视场表征所述至少两帧原始图像在扫描方向上的偏移情况;基于所述视场,对所述原始图像进行校正。上述方案,能够对图像进行校正,进而提高图像质量。
-
公开(公告)号:CN113781352A
公开(公告)日:2021-12-10
申请号:CN202111087980.X
申请日:2021-09-16
Applicant: 科大讯飞股份有限公司
Abstract: 本发明提供一种去光照方法、装置、电子设备与存储介质,方法包括:确定待去光照的图像;基于去光照模型,对图像进行去光照操作,得到图像对应的无光图像;去光照模型是以图像一致性为约束,基于样本图像对,联合加光照模型循环训练得到的,样本图像对包括样本有光图像和样本无光图像;图像一致性包括样本无光图像和预测无光图像的一致性,和/或,样本有光图像和预测有光图像的一致性,预测无光图像是去光照模型基于样本有光图像生成的,预测有光图像是加光照模型基于样本无光图像生成的。本发明提供的方法、装置、电子设备与存储介质,能够得到更加真实自然的无光图像,同时可以避免现有方法鲁棒性差、图像颜色信息丢失的问题。
-
公开(公告)号:CN112733855A
公开(公告)日:2021-04-30
申请号:CN202011615053.6
申请日:2020-12-30
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种表格结构化方法、表格恢复系统以及具有存储功能的装置。本申请的表格结构化方法充分利用深度学习方案得到单元格的位置信息和文字信息,准确挖掘表格线和单元格定点位置信息,从而获得准确的表格结构化。
-
公开(公告)号:CN111914805A
公开(公告)日:2020-11-10
申请号:CN202010831851.6
申请日:2020-08-18
Applicant: 科大讯飞股份有限公司
IPC: G06K9/00
Abstract: 本发明实施例提供一种表格结构化方法、装置、电子设备及存储介质,所述方法包括:确定待结构化图像所包含表格的单元格信息和文本信息;基于单元格信息,对表格中各个线段进行延伸,得到表格的最小单元尺寸,基于最小单元尺寸建立网格;基于单元格信息和文本信息,将表格中的各个单元格以及各个文本行映射到网格中,得到表格的结构化信息。本发明实施例提供的表格结构化方法、装置、电子设备及存储介质,实现了不同结构的表格的统一形式的结构化表示,有利于实现对电子化后的表格的统一管理。
-
-
-
-
-
-
-
-
-