-
公开(公告)号:CN117765558A
公开(公告)日:2024-03-26
申请号:CN202311738717.1
申请日:2023-12-15
Applicant: 科大讯飞股份有限公司
IPC: G06V30/414 , G06V30/148 , G06V30/18 , G06V30/19 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明提供一种题块区域划分方法、题块区域划分模型的训练方法及装置,其中方法包括:获取待分割的试题图像;对试题图像进行题块区域检测,得到试题图像中的候选题块区域的区域特征和位置特征;基于候选题块区域的区域特征和位置特征,确定候选题块区域之间的关系,并基于候选题块区域之间的关系,从候选题块区域中确定试题图像的题块区域。本发明提供的方法及装置,基于候选题块区域的区域特征和位置特征,确定候选题块区域之间的关系,加强候选题块区域之间的信息交互,学习到整图题型分布,从而确保后续基于候选题块区域之间的关系,从候选题块区域中确定出的试题图像的题块区域是较为独立的题型,进而提高了题块区域划分的准确性和可靠性。
-
公开(公告)号:CN117576704A
公开(公告)日:2024-02-20
申请号:CN202311476055.5
申请日:2023-11-03
Applicant: 科大讯飞股份有限公司 , 中国科学技术大学
Abstract: 本申请提出一种文本识别方法、装置、电子设备及存储介质,该方法包括:对待识别文本图像进行视觉特征提取,并对提取的视觉特征进行非自回归序列解码得到初始识别文本;对初始识别文本进行基于上下文的文本特征提取处理,得到初始识别文本的文本特征;对视觉特征和文本特征进行对齐融合处理,得到融合特征,并对融合特征进行非自回归序列解码,得到待识别数据对应的识别文本。采用本方案,对融合特征进行非自回归序列解码,并且融合特征是由视觉特征和包含上下文信息的文本特征融合得到的,提高了解码特征的特征量和特征丰富程度,通过融合特征捕获了不同文本特征之间的关联性,从而提高了解码过程中各个字符之间的关联性,能够提高解码准确度。
-
公开(公告)号:CN110598575B
公开(公告)日:2023-06-02
申请号:CN201910773607.6
申请日:2019-08-21
Applicant: 科大讯飞股份有限公司
IPC: G06V30/413 , G06V30/414
Abstract: 本申请实施例公开了一种表格版面分析与提取方法及相关装置,方法包括:获取包含表格版面的图片;确定图片中符合表格线约束条件的多个单连通链集合,多个单连通链集合中每个单连通链集合包括至少一条单连通链,单连通链对应于图片中的横向或竖向的短线段,表格线约束条件是指单连通链的方向相同且处于同一直线;根据每个单连通链集合包含的至少一条单连通链,生成每个单连通链集合对应的参考表格线;根据多个单连通链集合对应的多个参考表格线,生成图片的表格版面。本申请有利于提高表格版面提取的效率和准确率。
-
公开(公告)号:CN116188258A
公开(公告)日:2023-05-30
申请号:CN202211524299.1
申请日:2022-11-29
Applicant: 科大讯飞股份有限公司
IPC: G06T3/40 , G06T7/10 , G06V10/774 , G06V10/82
Abstract: 本申请提出一种数据采集方法、模型训练方法、图像拼接方法及相关装置,能够获取待裁剪的目标图像,基于图像采集设备的图像采集属性数据,计算确定将目标图像作为拼接后的图像时,图像采集设备采集得到的用于拼接目标图像的图像序列中相邻待拼接图像之间的偏移量,其中,图像采集属性数据表示由图像采集设备采集的图像拼接而成的拼接图像中,单位尺寸对应的待拼接图像的数量,按照偏移量对目标图像进行待拼接图像裁剪处理,得到图像序列。基于此,本申请能够自动生成大量的有重叠部分的图像序列,以及自动对图像序列中相邻图像的重叠部分的偏移量进行标注,方便快捷。
-
公开(公告)号:CN116152839A
公开(公告)日:2023-05-23
申请号:CN202310156082.8
申请日:2023-02-20
Applicant: 科大讯飞股份有限公司
IPC: G06V30/413 , G06V30/18 , G06V10/82 , G06N3/08 , G06N3/04
Abstract: 本发明提供了一种表格识别方法、装置、设备及存储介质,方法包括:获取用户在屏幕上书写时收集的轨迹点序列,并对轨迹点序列进行预处理;从预处理后的轨迹点序列中确定出表格轨迹点以及文本轨迹点;将表格轨迹点渲染成图像,得到纯表格图像,并将文本轨迹点渲染成图像,得到文本图像;对纯表格图像进行表格识别,得到表格识别结果,并对文本图像进行文本识别,得到文本识别结果;将表格识别结果与文本识别结果匹配,得到匹配结果;基于包含表格识别结果、文本识别结果以及匹配结果的识别信息,生成包含文本内容的表格。本发明提供的表格识别方法可还原出用户书写的包含文本内容的表格。
-
公开(公告)号:CN113807295A
公开(公告)日:2021-12-17
申请号:CN202111124148.2
申请日:2021-09-24
Applicant: 科大讯飞股份有限公司
IPC: G06K9/00
Abstract: 本发明提供一种手写识别方法、装置、电子设备和存储介质,所述方法包括:基于预设手写模式和手写轨迹序列,确定用于规整所述手写轨迹序列中各手写字符高度的目标字高;将各手写字符的高度规整至目标字高,得到规整轨迹序列;基于规整轨迹序列进行手写识别。本发明提供的手写识别方法、装置、电子设备和存储介质,能够使得各种手写模式下的各手写字符均能调整至统一的目标字高,避免各手写字符高度不一影响手写识别精度的问题。
-
公开(公告)号:CN112949653A
公开(公告)日:2021-06-11
申请号:CN202110204628.3
申请日:2021-02-23
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种文本识别方法以及电子设备、存储装置,其中,文本识别方法包括:获取待识别图像;其中,待识别图像内含有至少一个目标文本;对待识别图像进行特征提取,得到待识别图像的特征图;利用特征图进行目标检测,得到分别与至少一个目标文本对应的目标区域;识别目标区域中的目标文本和目标文本的文本类型。上述方案,能够提高文本识别的准确性。
-
公开(公告)号:CN112465931A
公开(公告)日:2021-03-09
申请号:CN202011405952.3
申请日:2020-12-03
Applicant: 科大讯飞股份有限公司
IPC: G06T11/40
Abstract: 本申请公开了一种图像文本抹除方法、相关设备及可读存储介质,在获取待抹除文本图像之后,利用该待抹除文本图像中的前景像素点以及背景像素点,确定该待抹除文本图像中的待抹除像素点,然后对待抹除像素点进行抹除,即可得到与待抹除文本图像对应的抹除文本后的图像。上述方案中,由于该待抹除文本图像中的背景像素点中可能包含待抹除文本边缘的噪声点,因此本申请中,不只对待抹除文本图像中的全部前景像素点进行抹除,还对背景像素点进行抹除,相对于只对前景像素点进行抹除,抹除效果更好。
-
公开(公告)号:CN119832571A
公开(公告)日:2025-04-15
申请号:CN202411801181.8
申请日:2024-12-09
Applicant: 科大讯飞股份有限公司
IPC: G06V30/226 , G06V30/414
Abstract: 本发明提供一种试题批改方法、装置、设备和存储介质,涉及图像处理技术,该方法包括:获取待批改试题的文本图像;针对所有所述待批改试题中的各手写文本行,遍历所述文本图像中的各作答区,确定所述手写文本行与当前遍历的第一作答区之间的第一重叠度;基于各所述第一重叠度确定所述手写文本行对应的至少一个目标作答区;基于各所述目标作答区对应的标准答案对所述手写文本行进行批改。本发明可以提高试题批改的准确性。
-
公开(公告)号:CN119226459A
公开(公告)日:2024-12-31
申请号:CN202411243765.8
申请日:2024-09-05
Applicant: 科大讯飞股份有限公司
IPC: G06F16/332 , G06F40/126 , G06F40/35 , G06F18/213 , G06F18/214 , G06N3/0455
Abstract: 本申请公开了一种智能对话方法及相关装置、设备和存储介质,其中,智能对话方法包括:基于以自然语言表示的第一语句,转换得到以机器语言表示的第一特征序列;基于智能对话模型处理第一特征序列,得到以机器语言表示的第二特征序列;其中,第二特征序列包含用于回复第一语句的特征信息;基于第二特征序列,转换得到以自然语言表示且用于回复第一语句的第二语句。上述方案,能够提升智能对话的准确性和效率。
-
-
-
-
-
-
-
-
-