-
公开(公告)号:CN112801088B
公开(公告)日:2024-05-31
申请号:CN202011640209.6
申请日:2020-12-31
Applicant: 科大讯飞股份有限公司
IPC: G06V30/146
Abstract: 本申请公开了一种扭曲文本行图像矫正的方法和相关装置,该方法包括:对扭曲文本行图像进行骨架提取和骨架拟合,获得扭曲文本行图像的骨架曲线公式;利用骨架曲线公式对扭曲文本行图像进行轮廓分割,获得扭曲文本行图像的轮廓曲线段;针对轮廓曲线段和轮廓曲线段上采样点,确定映射直线段和映射直线段上映射点;利用采样点至映射点的映射关系和预设映射变换算法,矫正扭曲文本行图像。可见,先通过扭曲文本行图像的骨架,将扭曲文本行图像的轮廓分为轮廓曲线段;再将轮廓曲线段映射为映射直线段,实现对扭曲文本行图像的矫正。该方式适用于大多数的、普通的扭曲文本行图像的矫正。
-
公开(公告)号:CN117994789A
公开(公告)日:2024-05-07
申请号:CN202410115866.0
申请日:2024-01-26
Applicant: 科大讯飞股份有限公司
IPC: G06V30/148 , G06V30/19 , G06V10/82
Abstract: 本申请提出一种文本行识别方法、装置、设备、存储介质和产品,该方法包括:当扫描获取的待识别文本图像的长度大于设定长度阈值时,对获取的待识别文本图像进行文本行检测,得到文本行检测结果和单字符检测结果;所述单字符检测结果包括检测到的文本行中的单个字符所占据的图像区域;根据所述单字符检测结果,从所述文本行检测结果中分割出包括检测到的完整字符的待识别文本段;对所述待识别文本段进行文本识别,得到识别文本。上述方案能够实现“边扫边出”的文本图像扫描识别效果,并且具有较高的识别准确性和识别效率。
-
公开(公告)号:CN117079170A
公开(公告)日:2023-11-17
申请号:CN202210493408.1
申请日:2022-05-07
Applicant: 科大讯飞股份有限公司
IPC: G06V20/40 , G06V10/74 , G06V10/774 , G06V10/82 , G06N3/0442 , G06N3/08
Abstract: 本发明提供了一种多目标跟踪方法、装置、设备及存储介质,方法包括:获取第一视频帧对应的目标跟踪信息和当前视频帧的目标检测集,第一视频帧为当前视频帧的前向相邻帧,目标跟踪信息包括多个级别分别对应的跟踪集,其通过对截至第一视频帧跟踪的若干第一目标分别对应的跟踪子集进行分级得到,目标检测集包括从当前视频帧检测出的若干第二目标分别对应的检测子集;按级别由高到低的顺序对多个级别分别对应的跟踪集包含的跟踪子集与目标检测集包含的检测子集进行匹配,基于匹配结果对多个级别分别对应的跟踪集进行更新,多个级别分别对应的更新后跟踪集作为当前视频帧对应的目标跟踪信息。本发明提供的多目标跟踪方法具有较好的跟踪效果。
-
公开(公告)号:CN114332900A
公开(公告)日:2022-04-12
申请号:CN202111660693.3
申请日:2021-12-30
Applicant: 科大讯飞股份有限公司
IPC: G06V30/414 , G06V30/42 , G06F16/583 , G06Q50/20
Abstract: 本申请实施例公开了一种作业批改方法、装置、设备及存储介质,获取包含待批改作业的目标图像后,对目标图像进行目标识别,以确定目标图像中的各个题目区域,各个手写答案区域,以及各个题目区域对应的题型;对各个题目区域和手写答案区域进行字符识别,确定各个题目区域和手写答案区域的文本;对应每一题目区域,确定与该题目区域的文本关联的手写答案区域的文本;根据该题目区域的文本,该题目区域的文本关联的手写答案区域的文本,以及该题目区域对应的题型,确定该题目区域的文本关联的手写答案区域的文本对应的批改结果。实现了对待批改作业中的各个题目的自动批改,从而可以辅助老师提高作业批改效率。
-
公开(公告)号:CN114255469A
公开(公告)日:2022-03-29
申请号:CN202111571821.7
申请日:2021-12-21
Applicant: 科大讯飞股份有限公司
IPC: G06V30/32 , G06V10/764
Abstract: 本发明提供一种手写识别方法、装置、电子设备和存储介质,确定待识别的笔划序列;基于所述笔划序列中各笔划的笔划特征,对所述各笔划进行分类,得到所述各笔划的笔划类别;基于所述各笔划的笔划类别,对所述笔划序列进行手写识别,本发明实施例中,针对所有的笔划进行统一建模,克服了传统方案中手写识别方法局限于单一的手写数据的缺陷,实现了文本和图形的统一识别,与此同时,还保证了手写识别的自由性以及手写功能的多样性。
-
公开(公告)号:CN112767318A
公开(公告)日:2021-05-07
申请号:CN202011642571.7
申请日:2020-12-31
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种图像处理效果的评价方法、装置、存储介质及设备,该方法包括:首先,获取待评价的目标图像处理效果,包括目标图像中文本行的文字涂抹图像、文本行的文字区域掩膜图像和文本行的颜色预测结果,然后,生成目标图像处理效果的评价指标,包括第一评价指标、第二评价指标、第三评价指标、第四评价指标以及第五评价指标中的至少一个,进而可以根据评价指标,确定目标图像处理效果的处理质量,可见,本申请在对目标图像处理效果的处理质量进行评价时,考虑了目标图像中文本行的文字涂抹图像、文本行的文字区域掩膜图像和文本行的颜色预测结果之间的关联关系,从而能够利用各个评价指标,自动且更准确地评价图像处理效果的处理质量。
-
公开(公告)号:CN112052909A
公开(公告)日:2020-12-08
申请号:CN202010981581.7
申请日:2020-09-17
Applicant: 科大讯飞股份有限公司
IPC: G06K9/62
Abstract: 本发明实施例提供一种图形匹配方法、装置、电子设备和存储介质,其中方法包括:对待匹配的第一图形和第二图形分别进行轮廓提取,得到所述第一图形的第一轮廓以及所述第二图形的第二轮廓;基于所述第一轮廓中的各第一轮廓点与所述第二轮廓中各第二轮廓点之间的对应关系,确定对所述第一轮廓进行平面几何变换后比对得到的图形匹配结果;其中,所述对所述第一轮廓进行平面几何变换的目标是最小化各第一轮廓点及其对应的第二轮廓点间的距离。本发明实施例提供的图形匹配方法、装置、电子设备和存储介质,提高了图形匹配结果的精确性,同时更精确地反映出了第一轮廓与第二轮廓之间具体的差异之处。
-
公开(公告)号:CN111192346A
公开(公告)日:2020-05-22
申请号:CN201911368067.X
申请日:2019-12-26
Applicant: 科大讯飞股份有限公司
IPC: G06T11/60
Abstract: 本发明公开了一种电子菜单生成方法、装置和设备。其中方法具体是基于文本检测识别技术与图像处理技术,针对原始菜单图像进行结构化分析,根据菜单上的排版特征信息将菜单上的文本块识别为菜名和价格,然后将菜名与对应价格关联起来,并根据关联关系生成电子菜单,由于无需事先准备包含产品信息的数据库用以识别和检测,因此可以极大地拓宽了其适用范围,而且提高电子菜单生成效率,能够快速将纸质菜单转换为电子菜单,供商家和用户使用。并且,本发明还相应地提供了一种计算机可读存储介质以及一种计算机程序产品。
-
公开(公告)号:CN110084229A
公开(公告)日:2019-08-02
申请号:CN201910228663.1
申请日:2019-03-25
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提供了一种印章检测方法、装置、设备及可读存储介质,首先获取待检测图像,然后从待检测图像中检测疑似印章区域,获得疑似印章区域集合,最后基于真实印章的固有特征,从疑似印章区域集合中确定真实印章区域。本申请提供的印章检测方法能够基于印章的固有特征自动对待检测图像进行印章检测,这种检测方式不但节省了人工成本,而且提高了印章检测效率,并且,本申请提供的印章检测方法具有较高的检测准确度。
-
公开(公告)号:CN112465931B
公开(公告)日:2024-05-31
申请号:CN202011405952.3
申请日:2020-12-03
Applicant: 科大讯飞股份有限公司
IPC: G06T11/40
Abstract: 本申请公开了一种图像文本抹除方法、相关设备及可读存储介质,在获取待抹除文本图像之后,利用该待抹除文本图像中的前景像素点以及背景像素点,确定该待抹除文本图像中的待抹除像素点,然后对待抹除像素点进行抹除,即可得到与待抹除文本图像对应的抹除文本后的图像。上述方案中,由于该待抹除文本图像中的背景像素点中可能包含待抹除文本边缘的噪声点,因此本申请中,不只对待抹除文本图像中的全部前景像素点进行抹除,还对背景像素点进行抹除,相对于只对前景像素点进行抹除,抹除效果更好。
-
-
-
-
-
-
-
-
-