-
公开(公告)号:CN118334685A
公开(公告)日:2024-07-12
申请号:CN202410515506.X
申请日:2024-04-26
Applicant: 科大讯飞股份有限公司
IPC: G06V30/41 , G06V30/413 , G06V30/18 , G06V30/19 , G06V10/82 , G06N3/0455 , G06N3/08
Abstract: 本发明涉及图像识别技术领域,提供一种文档版面分析方法、装置、电子设备及存储介质,该方法中引入了版面信息单元集合,并从中选取待分析文档图像对应的目标版面信息单元,将其对应的待分析文档图像的版面特征结合待分析文档图像的视觉特征,可以丰富待分析文档图像中各文档要素的特征信息,进而确定待分析文档图像中文档要素像素级别的位置信息,实现待分析文档图像中各文档要素的位置信息的精细化表示,提高各文档要素的位置信息的质量,在弯曲畸变场景仍能保证效果,同时提高了类似复杂场景下的文档版面分析效果。
-
公开(公告)号:CN113239978B
公开(公告)日:2024-06-04
申请号:CN202110436513.7
申请日:2021-04-22
Applicant: 科大讯飞股份有限公司
IPC: G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/047 , G06N3/084
Abstract: 本申请提供了一种医学图像预处理模型及分析模型的训练方法、识别方法和装置,其中,医学图像预处理模型的训练方法包括:利用医学图像预处理模型对第一医学图像样本进行预处理以获得预处理图像;利用保真判别器和第一医学图像样本对预处理图像进行真实性判定以获得真实性判定结果,并利用领域判别器对预处理图像进行领域标签判定以获得领域判定结果;利用真实性判定结果获得保真判别器反向梯度,并利用领域判定结果获得领域判别器反向梯度;利用保真判别器的反向梯度和领域判别器的反向梯度更新医学图像预处理模型的参数,以使得具有不同领域标签的预处理图像具有相同的外观特征。通过上述方式,本申请可以实现不同成像条件下医学图像数据的标准化。
-
公开(公告)号:CN117911321A
公开(公告)日:2024-04-19
申请号:CN202311685627.0
申请日:2023-12-04
Applicant: 科大讯飞股份有限公司
IPC: G06T7/00 , G06V30/413 , G06V30/162 , G06V30/18
Abstract: 本申请公开了一种图文混排图像的评测方法、装置、设备和存储介质,其中,图文混排图像的评测方法包括:基于图文混排图像进行文本检测,至少得到文本轮廓信息;基于文本轮廓信息,得到图像掩膜,并基于图像掩膜,确定图文混排图像中的图形区域和文本区域;基于由文本区域得到的识别文本、图形区域的原始图形分别进行评测,得到图文混排图像的评测结果。上述方案,能够提升图文混排图像的评测效率和评测准确率。
-
公开(公告)号:CN117789233A
公开(公告)日:2024-03-29
申请号:CN202410132267.X
申请日:2024-01-30
Applicant: 科大讯飞股份有限公司
IPC: G06V30/413 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/0442 , G06N3/08
Abstract: 本申请实施例公开了一种文本识别方法、装置、设备及存储介质,对图片进行编码,得到编码特征后,对编码特征进行解码时,按文本片段进行解码,且每个文本片段的解码过程引入了该文本片段在图片中的位置,也就是说,本申请在对编码特征解码过程中不仅对文本进行解码,还对文本片段在图片中的位置进行解码,且每个文本片段是基于先解码得到的该文本片段在图片中的位置解码得到的,因此,文本片段的解码过程参考了更多的上下文信息,从而提高文本识别准确率。
-
公开(公告)号:CN117765558A
公开(公告)日:2024-03-26
申请号:CN202311738717.1
申请日:2023-12-15
Applicant: 科大讯飞股份有限公司
IPC: G06V30/414 , G06V30/148 , G06V30/18 , G06V30/19 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明提供一种题块区域划分方法、题块区域划分模型的训练方法及装置,其中方法包括:获取待分割的试题图像;对试题图像进行题块区域检测,得到试题图像中的候选题块区域的区域特征和位置特征;基于候选题块区域的区域特征和位置特征,确定候选题块区域之间的关系,并基于候选题块区域之间的关系,从候选题块区域中确定试题图像的题块区域。本发明提供的方法及装置,基于候选题块区域的区域特征和位置特征,确定候选题块区域之间的关系,加强候选题块区域之间的信息交互,学习到整图题型分布,从而确保后续基于候选题块区域之间的关系,从候选题块区域中确定出的试题图像的题块区域是较为独立的题型,进而提高了题块区域划分的准确性和可靠性。
-
公开(公告)号:CN117710992A
公开(公告)日:2024-03-15
申请号:CN202311707740.4
申请日:2023-12-12
Applicant: 科大讯飞股份有限公司
IPC: G06V30/19 , G06V10/82 , G06V30/18 , G06V30/262 , G06N3/0464 , G06N3/045 , G06N3/0442 , G06N3/0895
Abstract: 本发明公开了一种模型训练方法、文本识别方法及相关装置,包括:获取包含文本信息的样本图像及其对应的标签信息;将所述样本图像输入至第一模型,以获得上下文特征和文本序列;将所述上下文特征和所述文本序列输入第二模型中,以获取对应的文本预测结果,所述第二模型用于与所述第一模型进行联合训练;根据所述文本预测结果和所述标签信息计算第一损失,并根据所述文本序列和所述标签信息计算第二损失,以及使用所述第一损失和所述第二损失对所述第一模型进行更新迭代,直至达到预设条件,得到训练好的第一模型。本发明具有更好的特征提取能力,更好的文本识别性能。
-
公开(公告)号:CN117710411A
公开(公告)日:2024-03-15
申请号:CN202311665113.9
申请日:2023-12-06
Applicant: 科大讯飞股份有限公司
IPC: G06T7/246 , G06V10/74 , G06T7/73 , G06N3/0464 , G06N3/08
Abstract: 本申请提供一种关键点追踪方法及装置,包括:获取第一待处理图像的第一特征向量,第一待处理图像包括目标对象,第一特征向量包括目标对象中关键点的特征向量;根据第一待处理图像和第二待处理图像之间的时序关系以及关键点之间的空间关系,对第一特征向量进行处理,得到第二特征向量,其中,第二待处理图像包括目标对象,第二特征向量中关键点的特征向量学习到特定特征,特定特征包括关键点在第二待处理图像中的特征、与关键点存在空间关系的关键点在第一待处理图像中的特征;对第二特征向量进行解码,得到解码结果,根据解码结果生成关键点的热图;根据关键点的热图,得到关键点的坐标。
-
公开(公告)号:CN117671248A
公开(公告)日:2024-03-08
申请号:CN202311792860.9
申请日:2023-12-22
Applicant: 科大讯飞股份有限公司
Abstract: 本发明公开了一种目标检测方法、装置以及存储介质、电子设备,检测方法包括:接收目标检测指令;根据目标检测指令确定检测目标的语义‑图像多模特征;利用语义‑图像多模特征对目标图像和目标图像携带的语义信息进行目标检测,得到检测结果。该方法无需针对特定的目标训练检测模型,即可实现对未预先定义类别的目标进行检测(即零样本目标检测),可使检测更全面,具有很好的实用性。
-
公开(公告)号:CN117576704A
公开(公告)日:2024-02-20
申请号:CN202311476055.5
申请日:2023-11-03
Applicant: 科大讯飞股份有限公司 , 中国科学技术大学
Abstract: 本申请提出一种文本识别方法、装置、电子设备及存储介质,该方法包括:对待识别文本图像进行视觉特征提取,并对提取的视觉特征进行非自回归序列解码得到初始识别文本;对初始识别文本进行基于上下文的文本特征提取处理,得到初始识别文本的文本特征;对视觉特征和文本特征进行对齐融合处理,得到融合特征,并对融合特征进行非自回归序列解码,得到待识别数据对应的识别文本。采用本方案,对融合特征进行非自回归序列解码,并且融合特征是由视觉特征和包含上下文信息的文本特征融合得到的,提高了解码特征的特征量和特征丰富程度,通过融合特征捕获了不同文本特征之间的关联性,从而提高了解码过程中各个字符之间的关联性,能够提高解码准确度。
-
公开(公告)号:CN117253387A
公开(公告)日:2023-12-19
申请号:CN202311031328.5
申请日:2023-08-14
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种绘画辅导方法、装置、设备及可读存储介质。首先,获取待辅导的绘画作品,然后确定绘画作品的描述信息,该绘画作品的描述信息用于描述绘画作品的绘画要素;再基于所述绘画作品的描述信息,以绘画老师的身份向所向所述用户进行主动发问,引导所述用户进入多轮对话任务,以对所述用户进行绘画辅导。基于该方案,可自动实现以绘画老师的身份,基于绘画作品的绘画要素对用户进行绘画辅导,用户无需依赖绘画老师,即可得到绘画辅导。
-
-
-
-
-
-
-
-
-