-
公开(公告)号:CN116311326A
公开(公告)日:2023-06-23
申请号:CN202310245433.2
申请日:2023-03-09
Applicant: 科大讯飞股份有限公司
IPC: G06V30/42 , G06V10/82 , G06N3/08 , G06N3/0464
Abstract: 本申请公开了一种手绘流程图识别方法、装置、存储介质及设备,通过目标检测网络来检测手绘流程图中的各个元素节点和线段关键点,并提取各个元素节点的视觉特征和线段关键点的关键点特征,其中,利用关键点特征提高线段表示的准确率,根据各个元素节点的视觉特征和线段关键点的关键点特征构建初始的图网络,并确定图网络中的顶点的初始特征和边的初始特征,并对图网络进行相应的图网络特征提取处理和分类处理,以得到手绘流程图中各个元素节点之间的连接关系,采用目标检测网络和图网络级联的方式来识别手绘流程图中的元素节点和连接关系的识别,提高手绘流程图识别的准确率。
-
公开(公告)号:CN115937869A
公开(公告)日:2023-04-07
申请号:CN202211699803.1
申请日:2022-12-28
Applicant: 科大讯飞股份有限公司
Abstract: 本发明提供一种汉字骨架生成方法、装置、电子设备和存储介质,其中方法包括:确定目标用户的手写汉字图像,以及目标汉字的标准轨迹序列;基于手写汉字图像进行风格提取,得到目标用户的手写风格特征;基于标准轨迹序列进行内容提取,得到目标汉字的内容结构特征;基于手写风格特征,以及内容结构特征,进行汉字骨架生成,得到目标用户对于目标汉字的手写轨迹序列,克服了传统方案中汉字骨架合成的风格相似性和结构稳定性难以保证,且使用场景较为局限的缺陷,实现了基于包含任意且少量手写汉字的手写汉字图像的稳定手写风格提取,不仅保证了生成汉字与手写汉字之间的风格一致性,还提升了生成汉字的内容正确性和结构稳定性,同时保证了应用范围。
-
公开(公告)号:CN115880701A
公开(公告)日:2023-03-31
申请号:CN202211699395.X
申请日:2022-12-28
Applicant: 科大讯飞股份有限公司
IPC: G06V30/32
Abstract: 本发明提供一种字体生成方法、装置、电子设备和系统,涉及文字处理技术领域,该方法包括:获取待生成文字的标准笔画序列,并提取标准笔画序列的第一文字内容特征;获取手写字图像中的第一单字图像,并将第一单字图像输入风格特征提取模型,得到风格特征提取模型输出的第一书写风格特征;提取第一单字图像的第二文字内容特征,并从第一书写风格特征中去除第二文字内容特征,得到去除内容信息的第二书写风格特征;将第一文字内容特征和第二书写风格特征输入解码器,得到解码器输出的待生成文字对应的第一目标风格文字,解码器用于对文字内容特征和书写风格特征进行融合。本发明提供的技术方案能够生成个性化字体,提高字体的个性化程度。
-
公开(公告)号:CN115147859B
公开(公告)日:2025-01-03
申请号:CN202210909939.4
申请日:2022-07-29
Applicant: 科大讯飞股份有限公司
IPC: G06V30/42 , G06V30/142 , G06V30/148
Abstract: 本申请公开了一种文本处理方法、装置、设备及存储介质,通过摄像头对审阅者批注纸质作业文档的场景进行拍摄,获取到拍摄的视频,进而对视频中每一视频帧进行识别,得到每一视频帧中包含的审阅者手写体批注内容以及作答者的身份信息,基于识别到的每一视频帧的作答者的身份信息,对拍摄的视频进行切分,得到与每一身份的作答者对应的视频帧序列,基于每一身份的作答者对应的视频帧序列中各视频帧包含的审阅者手写体批注内容,可以分析得到每一身份的作答者的作业学情。本申请提供的方案对于审阅者而言是无感的,不需要改变审阅者的批注流程和习惯,也不需要审阅者去手动对批注后的纸质作业文档进行拍照操作,因此降低审阅者的工作量。
-
公开(公告)号:CN119206758A
公开(公告)日:2024-12-27
申请号:CN202411467104.3
申请日:2024-10-21
Applicant: 科大讯飞股份有限公司
IPC: G06V30/414 , G06V30/416 , G06V30/19 , G06N5/04 , G06N3/0464 , G06N3/045 , G06V10/82
Abstract: 本申请公开了一种文档识别方法、装置、相关设备及计算机程序产品,对于待识别文本可以拆分为多页文档图像,并分别提取每页文档图像的视觉特征,可以将多页文档图像的视觉特征同时送入大模型,同时提取第一文档识别指令的文本特征也送入大模型,所述第一文档识别指令用于指示大模型输出文档图像的文档识别结果,如此能够通过大模型端到端地输出多页文档的识别结果。由于大模型具有更强的建模能力,同时将多页文档图像的视觉特征送入大模型,可以保留不同页文档图像之间的上下文信息,进而能够理解文本的上下文语义,更精确地分析文档的层次结构和内容关系,从而提高文本识别和版面理解的准确性,提升多页文档的识别结果准确度。
-
公开(公告)号:CN119206733A
公开(公告)日:2024-12-27
申请号:CN202411470781.0
申请日:2024-10-21
Applicant: 科大讯飞股份有限公司
IPC: G06V30/148 , G06V30/16 , G06V30/226 , G06V10/82 , G06V30/19 , G06N3/08
Abstract: 本发明提供一种表达式识别方法、装置、电子设备和存储介质,其中方法包括:获取表达式图像;基于表达式图像的图像特征,对表达式图像进行符号识别,得到表达式图像的符号识别结果;基于图像特征和符号识别结果,对表达式图像进行符号校正和符号连通性预测,得到表达式图像的符号校正结果和符号连通关系;基于符号校正结果和符号连通关系,确定表达式图像对应的表达式。本发明提供的方法、装置、电子设备和存储介质,可以充分应用表达式图像的整体视觉特性,从而保证表达式识别的准确性和可靠性;并且,可以一次性输出表达式图像中所有符号的符号校正结果和符号连通关系,这种非自回归的形式能够大大提高表达式的识别效率。
-
公开(公告)号:CN118411733A
公开(公告)日:2024-07-30
申请号:CN202410132276.9
申请日:2024-01-30
Applicant: 科大讯飞股份有限公司
IPC: G06V30/413 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/0442 , G06N3/09 , G06N3/088 , G06N3/084
Abstract: 本申请实施例公开了一种文本识别方法、装置、设备及存储介质,先对图片进行特征提取,得到视觉特征,然后对视觉特征进行处理,得到文本识别结果,该文本识别结果以标记语言表述图片中的文本内容及其版面信息,也就是说,基于本申请生成了更加丰富的文本识别结果,提高了文本识别的智能性。
-
公开(公告)号:CN117671707A
公开(公告)日:2024-03-08
申请号:CN202311543468.0
申请日:2023-11-15
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种提供一种文字识别方法、系统以及相关装置,该方法包括:获取待识别图像的初始特征;基于上一解码轮次对应的解码区域,获取当前解码轮次中所述待识别图像对应的解码步长;其中,所述解码区域与所述待识别图像中的部分区域匹配;基于所述解码步长和所述初始特征,获取所述当前解码轮次对应的当前解码特征;基于所述当前解码特征,获取所述当前解码轮次对应的解码文字。通过上述方式,本申请能够提高文字识别的效率和准确性。
-
公开(公告)号:CN116665233A
公开(公告)日:2023-08-29
申请号:CN202310234564.0
申请日:2023-03-07
Applicant: 科大讯飞股份有限公司
IPC: G06V30/412 , G06V30/146 , G06F40/177
Abstract: 本申请提出一种手写表格识别方法及相关装置,该方法包括:对手写表格图像中的表格进行矫正处理,得到矫正表格图像;确定所述矫正表格图像中的各个单元格的位置,以及,识别所述矫正表格图像中的各个文本行以及各个文本行的位置;基于所述矫正表格图像中的各个单元格的位置、所述矫正表格图像中的各个文本行以及各个文本行的位置,生成电子表格。采用上述方案可以有效地将手写表格转换为电子表格。
-
公开(公告)号:CN115984877A
公开(公告)日:2023-04-18
申请号:CN202310130152.2
申请日:2023-02-07
Applicant: 科大讯飞股份有限公司
IPC: G06V30/226 , G06V30/19 , G06V30/146
Abstract: 本发明涉及模式识别技术领域,提供一种手写识别方法、装置、电子设备和存储介质,其中方法包括:确定待识别的手写数据,手写数据包括匹配的笔画轨迹和手写图像;基于轨迹编码器,提取笔画轨迹的轨迹特征,并基于图像编码器,提取手写图像的图像特征,轨迹编码器和图像编码器采用差异化的训练策略训练得到;基于双模态解码器,应用图像特征和轨迹特征之间的差异化信息,将轨迹特征和图像特征进行融合,并基于融合后的特征进行手写识别。本发明提供的手写识别方法、装置、电子设备和存储介质,能够显著提升在双模态数据不匹配场景下的识别能力。
-
-
-
-
-
-
-
-
-