-
公开(公告)号:CN116311326A
公开(公告)日:2023-06-23
申请号:CN202310245433.2
申请日:2023-03-09
Applicant: 科大讯飞股份有限公司
IPC: G06V30/42 , G06V10/82 , G06N3/08 , G06N3/0464
Abstract: 本申请公开了一种手绘流程图识别方法、装置、存储介质及设备,通过目标检测网络来检测手绘流程图中的各个元素节点和线段关键点,并提取各个元素节点的视觉特征和线段关键点的关键点特征,其中,利用关键点特征提高线段表示的准确率,根据各个元素节点的视觉特征和线段关键点的关键点特征构建初始的图网络,并确定图网络中的顶点的初始特征和边的初始特征,并对图网络进行相应的图网络特征提取处理和分类处理,以得到手绘流程图中各个元素节点之间的连接关系,采用目标检测网络和图网络级联的方式来识别手绘流程图中的元素节点和连接关系的识别,提高手绘流程图识别的准确率。
-
公开(公告)号:CN118411733A
公开(公告)日:2024-07-30
申请号:CN202410132276.9
申请日:2024-01-30
Applicant: 科大讯飞股份有限公司
IPC: G06V30/413 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/0442 , G06N3/09 , G06N3/088 , G06N3/084
Abstract: 本申请实施例公开了一种文本识别方法、装置、设备及存储介质,先对图片进行特征提取,得到视觉特征,然后对视觉特征进行处理,得到文本识别结果,该文本识别结果以标记语言表述图片中的文本内容及其版面信息,也就是说,基于本申请生成了更加丰富的文本识别结果,提高了文本识别的智能性。
-
公开(公告)号:CN116343235A
公开(公告)日:2023-06-27
申请号:CN202310141914.9
申请日:2023-02-13
Applicant: 科大讯飞股份有限公司
IPC: G06V30/226 , G06V30/18 , G06V10/80
Abstract: 本申请提供了文本的识别方法、装置、设备及存储介质,具体实现方案为:获取待识别文本的动态笔迹的点级轨迹信息和笔画级轨迹信息;利用所述点级轨迹信息和所述笔画级轨迹信息确定对应的轨迹点特征;基于所述轨迹点特征得到所述待识别文本的识别结果。根据本申请的技术方案,能够有效提升手写文本识别的准确性。
-
公开(公告)号:CN119649378A
公开(公告)日:2025-03-18
申请号:CN202411674214.7
申请日:2024-11-21
Applicant: 科大讯飞股份有限公司
IPC: G06V30/18 , G06F40/232
Abstract: 本申请公开了一种错字识别方法、装置、设备和存储介质,该方法包括:获取待识别文字的第一笔画序列、以及待识别文字对应的正确文字的第二笔画序列;对第一笔画序列和第二笔画序列进行笔画匹配,分别确定待识别文字中未成功匹配的第一差异笔画和正确文字中未成功匹配的第二差异笔画;利用错字识别模型基于第一差异笔画和第二差异笔画进行错字识别,确定待识别文字的目标识别结果,目标识别结果用于表征待识别文字是否为错字。通过上述方式,本申请能够提高错字识别的准确度。
-
公开(公告)号:CN119919951A
公开(公告)日:2025-05-02
申请号:CN202411762621.3
申请日:2024-12-03
Applicant: 科大讯飞股份有限公司
IPC: G06V30/412 , G06V10/26 , G06V10/44 , G06V10/82 , G06N3/0455 , G06N3/0499 , G06N3/08 , G06F40/18
Abstract: 本申请提出一种表格的还原方法、装置、电子设备和计算机程序产品,该方法从包含待还原表格的目标图像中,提取得到待还原表格的表格位置信息和待还原表格中各单元格的单元格位置信息,根据表格位置信息,从目标图像中提取得到待还原表格的结构信息,其中结构信息包括各单元格的单元格内容和单元格内容在待还原表格中的地址,然后根据单元格位置信息确定各单元格的尺寸和各单元格在待还原表格中的地址,以便于根据结构信息以及各单元格的尺寸、各单元格在待还原表格中的地址进行单元格复原,如此设置可以复原出各单元格的尺寸、各单元格的内容和表格的布局,实现在数字化处理过程中还原该表格的目的。
-
公开(公告)号:CN117576704A
公开(公告)日:2024-02-20
申请号:CN202311476055.5
申请日:2023-11-03
Applicant: 科大讯飞股份有限公司 , 中国科学技术大学
Abstract: 本申请提出一种文本识别方法、装置、电子设备及存储介质,该方法包括:对待识别文本图像进行视觉特征提取,并对提取的视觉特征进行非自回归序列解码得到初始识别文本;对初始识别文本进行基于上下文的文本特征提取处理,得到初始识别文本的文本特征;对视觉特征和文本特征进行对齐融合处理,得到融合特征,并对融合特征进行非自回归序列解码,得到待识别数据对应的识别文本。采用本方案,对融合特征进行非自回归序列解码,并且融合特征是由视觉特征和包含上下文信息的文本特征融合得到的,提高了解码特征的特征量和特征丰富程度,通过融合特征捕获了不同文本特征之间的关联性,从而提高了解码过程中各个字符之间的关联性,能够提高解码准确度。
-
公开(公告)号:CN116935404A
公开(公告)日:2023-10-24
申请号:CN202310692381.3
申请日:2023-06-09
Applicant: 科大讯飞股份有限公司
IPC: G06V30/19 , G06V30/41 , G06V10/82 , G06N3/0442 , G06N3/0464 , G06N3/08
Abstract: 本申请公开了一种文本识别方法及相关装置、设备和存储介质,其中,文本识别方法包括:提取待识别图像的图像特征;基于图像特征执行如下第一解码操作:基于上一解码时刻的解码信息,从图像特征提取得到当前解码时刻的第一视觉特征;并基于当前解码时刻的第一视觉特征及上一解码时刻的解码信息,得到当前解码时刻的语言特征;及基于第一视觉特征和语言特征进行解码,得到当前解码时刻的解码字符;其中,解码信息包括解码字符、解码状态中至少一者,组合各个解码时刻的解码字符得到第一解码操作的候选识别文本;基于若干种解码操作各自的候选识别文本,得到待识别图像的目标识别文本。上述方案,能够提升文本识别的准确性,特别是在OOV上的准确性。
-
-
-
-
-
-