-
公开(公告)号:CN117237970A
公开(公告)日:2023-12-15
申请号:CN202311301393.5
申请日:2023-10-08
Applicant: 科大讯飞股份有限公司
IPC: G06V30/412 , G06V30/19
Abstract: 本申请提供了一种文本识别方法和相关装置,在对待识别文本图像进行文本识别的过程中,得到第一上下文特征和第一得分向量,在结合第一上下文特征对标准答案进行文本识别的过程中,得到第二得分向量。由于第一上下文特征能够在对标准答案进行文本识别的过程中增强对与待识别文本的形状相同或相近的目标答案内容的关注度,使得第二得分向量能够反映出标准答案是否包含目标答案内容,因此,可以根据第二得分向量确定是否对第一得分向量进行答案激励,若是,则对第一得分向量和第二得分向量进行得分融合,得到答案激励识别结果。由此可见,本申请在标准答案包含目标答案内容时,可以对待识别文本本身的识别结果进行答案激励,提高了识别准确度。
-
公开(公告)号:CN117789233A
公开(公告)日:2024-03-29
申请号:CN202410132267.X
申请日:2024-01-30
Applicant: 科大讯飞股份有限公司
IPC: G06V30/413 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/0442 , G06N3/08
Abstract: 本申请实施例公开了一种文本识别方法、装置、设备及存储介质,对图片进行编码,得到编码特征后,对编码特征进行解码时,按文本片段进行解码,且每个文本片段的解码过程引入了该文本片段在图片中的位置,也就是说,本申请在对编码特征解码过程中不仅对文本进行解码,还对文本片段在图片中的位置进行解码,且每个文本片段是基于先解码得到的该文本片段在图片中的位置解码得到的,因此,文本片段的解码过程参考了更多的上下文信息,从而提高文本识别准确率。
-
公开(公告)号:CN116030468A
公开(公告)日:2023-04-28
申请号:CN202211689264.3
申请日:2022-12-27
Applicant: 科大讯飞股份有限公司
IPC: G06V30/148 , G06V10/80 , G06V20/70 , G06V10/82 , G06N3/0442
Abstract: 本申请提供了一种阅读顺序的确定方法及装置、电子设备及存储介质,涉及图像处理技术领域。该阅读顺序的确定方法包括:获取目标文本图像中包括的文本行集合,文本行集合中包括至少一个文本行;确定至少一个文本行各自的特征向量;基于至少一个文本行各自的特征向量,对文本行集合进行至少一次文本行解码操作,得到至少一个文本行各自的阅读排序信息;基于至少一个文本行各自的阅读排序信息,确定至少一个文本行对应的阅读顺序。通过对文本行集合中各个文本行的特征向量进行文本行解码操作,得到各个文本行的阅读排序信息,再通过该阅读排序信息确定各个文本行对应的阅读顺序,提高了所确定的文本行的阅读顺序的准确性。
-
公开(公告)号:CN115223184A
公开(公告)日:2022-10-21
申请号:CN202210830460.1
申请日:2022-07-15
Applicant: 科大讯飞股份有限公司
IPC: G06V30/414 , G06F40/126 , G06F40/284 , G06F40/58
Abstract: 本发明提供了一种文本分块方法、图文翻译方法及相关设备,其中,文本分块方法包括:获取目标图片中的若干文本行分别对应的文本行信息;根据目标图片、目标图片中的若干文本行分别对应的文本行信息,获取目标图片中的若干文本行分别对应的文本行特征;根据目标图片中的若干文本行分别对应的文本行特征,对目标图片中的若干文本行进行分块。本发明提供的文本分块方法可实现对图片中的若干文本行进行分块。在本发明提供的文本分块方法的基础上,本发明还提供了一种图文翻译方法,该翻译方法以文本块为单位进行翻译,由于一个文本块中的各文本行具有语义关系,因此,以文本块为单位进行翻译能够获得较为准确、连贯、通顺的译文。
-
公开(公告)号:CN119919355A
公开(公告)日:2025-05-02
申请号:CN202411883298.5
申请日:2024-12-19
Applicant: 科大讯飞股份有限公司
IPC: G06T7/00 , G06V10/764 , G06V10/82 , G06N3/045 , G06Q50/20 , G06V10/774 , G06N3/0464 , G06V10/25
Abstract: 本申请提供了一种卷面分评分方法、装置、设备及产品。该方法属于机器学习技术领域。具体的,该方法包括:获取待评分试卷的作答区域图像;将作答区域图像输入预先训练的卷面分评分模型,得到与待评分试卷图像对应的卷面分评分结果;卷面分评分结果中包括卷面分数以及卷面评语;卷面分评分模型是用于根据作答区域图像从书写美观度、卷面整洁度、书写工整度、排版美观度以及总词数这五个维度对待评分试卷的卷面分进行评分的数学模型。根据本申请,能够根据待评分试卷的作答区域图像得到待评分试卷对应的卷面分评分,解决了人工评分和机器评分因卷面分而产生的打分差异的问题。
-
公开(公告)号:CN114255466A
公开(公告)日:2022-03-29
申请号:CN202111570376.2
申请日:2021-12-21
Applicant: 科大讯飞股份有限公司
IPC: G06V30/148 , G06F40/30 , G06T7/11 , G06V20/62
Abstract: 本发明提供一种文本分块方法、装置、电子设备和存储介质,其中方法包括:对待分块的文本图像进行文本检测,得到文本图像中的各个文本行的位置;基于各个文本行的位置、各个文本行在文本图像中的区域图像,以及各个文本行的识别文本,对文本图像进行文本分块,得到文本分块结果,从三个不同的角度评估文本图像中各个文本行的语句完整性以及各个文本行之间的语义连贯性,据此评估结果进行文本分块,能够克服传统方案中直接对单个文本行进行翻译,使得翻译结果的准确度不高以及实际效果不佳的缺陷,本发明实施例中,能够将具有语义关系的文本行串联在一起,从而为后续翻译任务的执行以及翻译结果准确率和实际效果的提升提供强大的助力。
-
-
-
-
-