-
公开(公告)号:CN114332871A
公开(公告)日:2022-04-12
申请号:CN202111671276.9
申请日:2021-12-31
Applicant: 科大讯飞股份有限公司
IPC: G06V30/148 , G06K9/62 , G06V10/74 , G06V10/774 , G06V30/19
Abstract: 本申请提出一种字符识别方法、装置、设备及存储介质,该方法包括:获取文本图像的解码特征,并根据所述解码特征,解码得到与所述文本图像对应的第一字符识别结果;通过将所述文本图像的解码特征,与预设字典中的各个字符的字符元素序列特征进行比对,确定与所述文本图像对应的第二字符识别结果;其中,所述字符元素序列由字符的各个构成元素,以及各个构成元素之间的位置关系信息组成;基于所述第一字符识别结果和所述第二字符识别结果,确定对所述文本图像的字符识别结果。采用上述方案能够取得更好的字符识别效果。
-
公开(公告)号:CN114255346A
公开(公告)日:2022-03-29
申请号:CN202111646060.7
申请日:2021-12-29
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种表格图像处理方法、相关设备及可读存储介质,在获取待处理的表格图像之后,先对该表格图像进行分割,得到该表格图像对应的基础网格单元,然后,确定出各基础网格单元的视觉特征以及各基础网格单元的文本语义特征,再基于各基础网格单元的视觉特征以及各基础网格单元的文本语义特征,确定各基础网格单元的结构信息,最后,根据各基础网格单元的结构信息,生成该表格图像对应的表格。本方案中,在将表格图像转化为表格时,同时考虑了表格图像的视觉信息以及文本语义信息,相对于仅利用表格图像的视觉信息转化表格,提升了转化的表格的精度。
-
公开(公告)号:CN119990314A
公开(公告)日:2025-05-13
申请号:CN202510056814.5
申请日:2025-01-14
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提供一种题目解答方法、装置、设备、介质及程序产品,该题目解答方法包括:基于决策树的根节点选择下一个子节点,直至到达一个叶子节点;决策树的节点包括由待解答题目的至少一个解答步骤组成的解答内容;在叶子节点不是终端节点的情况下,扩展叶子节点的各个子节点;确定叶子节点的各个子节点各自对应的特征,并基于各个特征,删除叶子节点的部分子节点,获得叶子节点的被保留子节点;基于叶子节点的被保留子节点,进行模拟和回溯,确定根节点的目标子节点,将目标子节点确定为决策树的根节点,返回执行基于决策树的根节点选择下一个子节点的步骤,直至生成待解答题目的完整解答内容。本申请能够提升多步骤题目解答的效率和准确率。
-
公开(公告)号:CN119832563A
公开(公告)日:2025-04-15
申请号:CN202411637370.6
申请日:2024-11-15
Applicant: 科大讯飞股份有限公司
IPC: G06V30/19 , G06V30/41 , G06V20/62 , G06V30/148
Abstract: 本发明提供一种答题模型训练、答题方法及装置,方法包括:获取预训练数据和训练数据,预训练数据包括第一题目图像、第一题目图像中第一题干文本以及用于描述第一题目图像中图形区域的第一描述文本,训练数据包括第二题目图像,以及第二题目图像对应的答案文本;基于预训练数据,对初始模型进行预训练,得到预训练模型;基于预训练模型,确定第二题目图像对应的预测答案文本;基于预测答案文本,以及答案文本,对预训练模型进行模型微调,得到答题模型。本发明提供的答题模型训练、答题方法及装置,在保证答题准确性的同时,提升了答题效率。
-
公开(公告)号:CN114332871B
公开(公告)日:2024-12-31
申请号:CN202111671276.9
申请日:2021-12-31
Applicant: 科大讯飞股份有限公司
IPC: G06V30/148 , G06V10/74 , G06V10/774 , G06V30/19
Abstract: 本申请提出一种字符识别方法、装置、设备及存储介质,该方法包括:获取文本图像的解码特征,并根据所述解码特征,解码得到与所述文本图像对应的第一字符识别结果;通过将所述文本图像的解码特征,与预设字典中的各个字符的字符元素序列特征进行比对,确定与所述文本图像对应的第二字符识别结果;其中,所述字符元素序列由字符的各个构成元素,以及各个构成元素之间的位置关系信息组成;基于所述第一字符识别结果和所述第二字符识别结果,确定对所述文本图像的字符识别结果。采用上述方案能够取得更好的字符识别效果。
-
公开(公告)号:CN117612190A
公开(公告)日:2024-02-27
申请号:CN202311362989.6
申请日:2023-10-19
Applicant: 科大讯飞股份有限公司
IPC: G06V30/412 , G06V30/413
Abstract: 本发明提供一种表格全要素抽取方法、装置、电子设备及存储介质,该方法包括:获取目标表格中各初始单元格和各单元格文本;基于各初始单元格的各第一顶点的位置,确定与初始单元格对应的单元格,并基于各单元格的相对位置确定目标表格的结构信息,单元格之间具有公共的顶点;基于目标表格的结构信息和各单元格文本,确定目标表格中各单元格的属性信息,属性信息包括键或值;基于目标表格的结构信息和各单元格的属性信息,抽取目标表格中的全要素。基于目标表格的结构信息和各单元格的属性信息,可以正确抽取属性信息相对应的各要素,避免抽取的各要素的属性信息不对应的情况,进而可以提高要素抽取的准确度。
-
公开(公告)号:CN117576700A
公开(公告)日:2024-02-20
申请号:CN202311512589.9
申请日:2023-11-10
Applicant: 科大讯飞股份有限公司
IPC: G06V30/19 , G06V30/146 , G06F16/9032 , G06V30/42
Abstract: 本发明提供一种要素内容抽取方法、装置、电子设备及存储介质,该方法包括:获取目标图片中各文本行的文本;分别提取各文本行的文本各自对应的第一句子级token,以及至少一个问题文本对应的第二句子级token,各问题文本包括要素字段;将各第一句子级token和各第二句子级token均输入要素抽取模型,得到要素抽取模型输出的要素字段对应的要素内容。针对文本行整体提取该文本行对应的第一句子级token,可实现第一句子级token与文本行一一对应,因此,有效增加了token表征的文本内容的长度,即使在输入的token总数量受限的情况下,也能输入较长的文本,并能对该文本进行要素内容提取,提高了适用性。
-
公开(公告)号:CN116343246A
公开(公告)日:2023-06-27
申请号:CN202310436283.3
申请日:2023-04-19
Applicant: 科大讯飞股份有限公司
IPC: G06V30/412 , G06V30/413 , G06V30/148 , G06V30/18 , G06V30/19
Abstract: 本发明提供了一种表格结构识别方法、装置、设备及存储介质,表格结构识别方法包括:获取目标表格图像;获取目标表格图像在列维度的全局视觉特征和在行维度的全局视觉特征;基于目标表格图像在列维度的全局视觉特征预测表格列线,并基于目标表格图像在行维度的全局视觉特征预测表格行线;基于预测的表格列线和表格行线,将目标表格图像分割成基础网格;对通过分割得到各基础网格进行归并处理,得到目标表格图像对应的表格结构。本发明基于目标表格图像在行维度的全局视觉特征和在行维度的全局视觉特征,能够预测出较为精准的表格行列线,在此基础上进行表格图像的划分和基础网格的归并,可获得较为精准的表格结构。
-
公开(公告)号:CN115984878A
公开(公告)日:2023-04-18
申请号:CN202211678486.5
申请日:2022-12-26
Applicant: 科大讯飞股份有限公司
IPC: G06V30/244 , G06V30/19 , G06N3/09
Abstract: 本申请提供了一种错字检测方法及作业批改方法,涉及文字处理技术领域。该错字检测方法包括:获取目标图像,目标图像中包含待检测的目标字;基于目标图像,确定目标字对应的标准模板字,标准模板字的字内容与目标字的字内容相同,标准模板字为第一字体风格;基于目标图像,确定与目标字符合预设相似条件的第一参考字,第一参考字为正确字;基于第一参考字和标准模板字,确定目标字对应的错字检测结果。通过本申请中的方案,可以简化错字检测的流程,同时保证了错字检测的准确度。
-
公开(公告)号:CN119337109A
公开(公告)日:2025-01-21
申请号:CN202411227489.6
申请日:2024-09-03
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提供了一种模型优化方法、数据处理方法、装置、设备及程序产品,该模型优化方法包括:在获取到任务模型对第一任务数据进行处理得到的第i处理结果时,将所述第一任务数据和所述第i处理结果输入用于对所述任务模型的处理结果进行评价的评价模型,得到对应所述第i处理结果的第i评价结果;所述第一任务数据包括文本数据、图像数据、语音数据中的至少一种,所述任务模型用于执行文本处理任务、图像处理任务、语音处理任务中的至少一种任务;在基于所述第i评价结果确定需要对所述第i处理结果进行优化时,将所述第i评价结果输入所述任务模型,以使所述任务模型基于所述第i评价结果,对所述第一任务数据进行处理得到第i+1处理结果。
-
-
-
-
-
-
-
-
-