-
公开(公告)号:CN119919951A
公开(公告)日:2025-05-02
申请号:CN202411762621.3
申请日:2024-12-03
Applicant: 科大讯飞股份有限公司
IPC: G06V30/412 , G06V10/26 , G06V10/44 , G06V10/82 , G06N3/0455 , G06N3/0499 , G06N3/08 , G06F40/18
Abstract: 本申请提出一种表格的还原方法、装置、电子设备和计算机程序产品,该方法从包含待还原表格的目标图像中,提取得到待还原表格的表格位置信息和待还原表格中各单元格的单元格位置信息,根据表格位置信息,从目标图像中提取得到待还原表格的结构信息,其中结构信息包括各单元格的单元格内容和单元格内容在待还原表格中的地址,然后根据单元格位置信息确定各单元格的尺寸和各单元格在待还原表格中的地址,以便于根据结构信息以及各单元格的尺寸、各单元格在待还原表格中的地址进行单元格复原,如此设置可以复原出各单元格的尺寸、各单元格的内容和表格的布局,实现在数字化处理过程中还原该表格的目的。
-
公开(公告)号:CN118334685A
公开(公告)日:2024-07-12
申请号:CN202410515506.X
申请日:2024-04-26
Applicant: 科大讯飞股份有限公司
IPC: G06V30/41 , G06V30/413 , G06V30/18 , G06V30/19 , G06V10/82 , G06N3/0455 , G06N3/08
Abstract: 本发明涉及图像识别技术领域,提供一种文档版面分析方法、装置、电子设备及存储介质,该方法中引入了版面信息单元集合,并从中选取待分析文档图像对应的目标版面信息单元,将其对应的待分析文档图像的版面特征结合待分析文档图像的视觉特征,可以丰富待分析文档图像中各文档要素的特征信息,进而确定待分析文档图像中文档要素像素级别的位置信息,实现待分析文档图像中各文档要素的位置信息的精细化表示,提高各文档要素的位置信息的质量,在弯曲畸变场景仍能保证效果,同时提高了类似复杂场景下的文档版面分析效果。
-
公开(公告)号:CN117789233A
公开(公告)日:2024-03-29
申请号:CN202410132267.X
申请日:2024-01-30
Applicant: 科大讯飞股份有限公司
IPC: G06V30/413 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/0442 , G06N3/08
Abstract: 本申请实施例公开了一种文本识别方法、装置、设备及存储介质,对图片进行编码,得到编码特征后,对编码特征进行解码时,按文本片段进行解码,且每个文本片段的解码过程引入了该文本片段在图片中的位置,也就是说,本申请在对编码特征解码过程中不仅对文本进行解码,还对文本片段在图片中的位置进行解码,且每个文本片段是基于先解码得到的该文本片段在图片中的位置解码得到的,因此,文本片段的解码过程参考了更多的上下文信息,从而提高文本识别准确率。
-
公开(公告)号:CN117576704A
公开(公告)日:2024-02-20
申请号:CN202311476055.5
申请日:2023-11-03
Applicant: 科大讯飞股份有限公司 , 中国科学技术大学
Abstract: 本申请提出一种文本识别方法、装置、电子设备及存储介质,该方法包括:对待识别文本图像进行视觉特征提取,并对提取的视觉特征进行非自回归序列解码得到初始识别文本;对初始识别文本进行基于上下文的文本特征提取处理,得到初始识别文本的文本特征;对视觉特征和文本特征进行对齐融合处理,得到融合特征,并对融合特征进行非自回归序列解码,得到待识别数据对应的识别文本。采用本方案,对融合特征进行非自回归序列解码,并且融合特征是由视觉特征和包含上下文信息的文本特征融合得到的,提高了解码特征的特征量和特征丰富程度,通过融合特征捕获了不同文本特征之间的关联性,从而提高了解码过程中各个字符之间的关联性,能够提高解码准确度。
-
公开(公告)号:CN116935404A
公开(公告)日:2023-10-24
申请号:CN202310692381.3
申请日:2023-06-09
Applicant: 科大讯飞股份有限公司
IPC: G06V30/19 , G06V30/41 , G06V10/82 , G06N3/0442 , G06N3/0464 , G06N3/08
Abstract: 本申请公开了一种文本识别方法及相关装置、设备和存储介质,其中,文本识别方法包括:提取待识别图像的图像特征;基于图像特征执行如下第一解码操作:基于上一解码时刻的解码信息,从图像特征提取得到当前解码时刻的第一视觉特征;并基于当前解码时刻的第一视觉特征及上一解码时刻的解码信息,得到当前解码时刻的语言特征;及基于第一视觉特征和语言特征进行解码,得到当前解码时刻的解码字符;其中,解码信息包括解码字符、解码状态中至少一者,组合各个解码时刻的解码字符得到第一解码操作的候选识别文本;基于若干种解码操作各自的候选识别文本,得到待识别图像的目标识别文本。上述方案,能够提升文本识别的准确性,特别是在OOV上的准确性。
-
公开(公告)号:CN119992578A
公开(公告)日:2025-05-13
申请号:CN202510056895.9
申请日:2025-01-14
Applicant: 科大讯飞股份有限公司
IPC: G06V30/413 , G06V30/18 , G06V30/414 , G06V10/82
Abstract: 本申请提出一种表格识别方法及相关装置,涉及图像识别技术领域。该表格识别方法可以包括:提取表格图像的视觉特征;其中,所述视觉特征包括:表格行特征和表格列特征;基于所述表格行特征确定行线关键点,以及基于所述表格列特征确定列线关键点;基于所述行线关键点预测行分割线,以及基于所述列线关键点预测列分割线;基于预测得到的所述行分割线与所述列分割线,生成结构化表格。本申请提供的技术方案用于解决现有技术中表格识别准确性低的问题。
-
公开(公告)号:CN119649378A
公开(公告)日:2025-03-18
申请号:CN202411674214.7
申请日:2024-11-21
Applicant: 科大讯飞股份有限公司
IPC: G06V30/18 , G06F40/232
Abstract: 本申请公开了一种错字识别方法、装置、设备和存储介质,该方法包括:获取待识别文字的第一笔画序列、以及待识别文字对应的正确文字的第二笔画序列;对第一笔画序列和第二笔画序列进行笔画匹配,分别确定待识别文字中未成功匹配的第一差异笔画和正确文字中未成功匹配的第二差异笔画;利用错字识别模型基于第一差异笔画和第二差异笔画进行错字识别,确定待识别文字的目标识别结果,目标识别结果用于表征待识别文字是否为错字。通过上述方式,本申请能够提高错字识别的准确度。
-
公开(公告)号:CN115174814B
公开(公告)日:2024-06-04
申请号:CN202210908066.5
申请日:2022-07-29
Applicant: 科大讯飞股份有限公司
IPC: H04N23/67
Abstract: 本申请公开了一种对焦纸面及作业学情采集方法、装置、设备及存储介质,本申请获取到对包含指定用户的手写体批注内容的纸质文档拍摄的图片,从中识别出手写体批注内容对应的目标区域,控制摄像头在不同焦距下对目标区域进行拍摄,分别确定每一焦距对应的目标区域图片中手写体批注内容的清晰度,并选取清晰度最高的焦距作为目标焦距,以便摄像头基于目标焦距进行后续的拍摄。本申请中考虑到对于作业学情采集这一任务,指定用户的手写体批注内容是最重要的信息,以不同焦距下拍摄的手写体批注内容的清晰度作为筛选条件确定目标焦距,保证按照该目标焦距拍摄的图片中指定用户的手写体批注内容是清晰的,提升后续对作业学情的采集的准确度。
-
公开(公告)号:CN117787212A
公开(公告)日:2024-03-29
申请号:CN202311630251.3
申请日:2023-11-29
Applicant: 科大讯飞股份有限公司 , 中国科学技术大学
IPC: G06F40/109 , G06N3/094 , G06N3/0475
Abstract: 本申请公开了一种个性化手写字体生成方法、模型训练方法及相关设备,用户可以书写任意少量文字并拍摄得到文字图像,获取用户书写的每个文字的骨架结构图,从中选取设定数量个文字的骨架结构图,利用图像风格提取器对选取的文字的骨架结构图进行处理得到用户书写的风格特征,利用内容参考字特征提取器对指定的内容参考字进行处理得到内容结构特征,将风格特征和内容结构特征进行融合,利用融合特征生成具有用户书写风格的个性化字体。本申请方案仅需要用户书写少量的文字来提取风格特征,进而可以生成大量的具有用户书写风格的个性化字体,既能够保证与用户书写风格的统一,又可以保证生成的字体结构的正确性,相比现有技术节约成本,提升效率。
-
公开(公告)号:CN117197433A
公开(公告)日:2023-12-08
申请号:CN202311157821.1
申请日:2023-09-07
Applicant: 科大讯飞股份有限公司
Abstract: 本发明提供一种目标检测方法、装置、电子设备和存储介质,方法包括:获取视图图像,以及点云数据,视图图像和点云数据是针对同一空间采集得到的;基于点云数据,对视图图像进行深度预计和/或对空间下的鸟瞰图进行可见性分割,得到空间遮挡关系;基于空间遮挡关系,对视图图像和点云数据进行特征聚合,并基于聚合结果进行目标检测。本发明实施例提供的方法、装置,通过点云数据,对视图图像进行深度预计和/或对空间下的鸟瞰图进行可见性分割,得到空间遮挡关系,并应用空间遮挡关系指导视图图像和点云数据的特征聚合,从而避免聚合过程中反向投影的问题,避免在聚合过程中引入噪声,由此基于聚合结果进行目标检测,实现了准确可靠的目标检测。
-
-
-
-
-
-
-
-
-