-
公开(公告)号:CN117935285A
公开(公告)日:2024-04-26
申请号:CN202311868838.8
申请日:2023-12-28
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了文本合并方法、文本识别装置、电子设备和存储介质,该方法包括:获取待识别图像中的至少两个文本框信息;其中,每个文本框信息内包括一文本行内容;获取每个文本框信息对应的文本行特征,得到至少两个文本行特征;根据至少两个文本行特征之间的相似度,合并对应的文本行内容,得到待识别图像中具有连续语义信息的文本内容。上述方案,能够快速合并图像文本框中文本行内容,得到具有连续语义信息的文本内容。
-
公开(公告)号:CN119832563A
公开(公告)日:2025-04-15
申请号:CN202411637370.6
申请日:2024-11-15
Applicant: 科大讯飞股份有限公司
IPC: G06V30/19 , G06V30/41 , G06V20/62 , G06V30/148
Abstract: 本发明提供一种答题模型训练、答题方法及装置,方法包括:获取预训练数据和训练数据,预训练数据包括第一题目图像、第一题目图像中第一题干文本以及用于描述第一题目图像中图形区域的第一描述文本,训练数据包括第二题目图像,以及第二题目图像对应的答案文本;基于预训练数据,对初始模型进行预训练,得到预训练模型;基于预训练模型,确定第二题目图像对应的预测答案文本;基于预测答案文本,以及答案文本,对预训练模型进行模型微调,得到答题模型。本发明提供的答题模型训练、答题方法及装置,在保证答题准确性的同时,提升了答题效率。
-