-
公开(公告)号:CN118196804A
公开(公告)日:2024-06-14
申请号:CN202410143667.0
申请日:2024-02-01
Applicant: 科大讯飞股份有限公司
IPC: G06V30/14 , G06V30/148 , G06N3/04 , G06N3/08
Abstract: 本申请提出一种试题答案文本的处理方法、装置、设备、存储介质及计算机程序产品,该方法包括:获取试题答案图像;其中,所述试题答案图像包括初始答案文本;从试题答案图像中分割出各个答案区域;其中,每一项答案各自对应一个答案区域;对各个所述答案区域进行文字识别,得到所述初始答案文本中的各项答案;拼接各项答案,并在相邻所述答案之间插入分隔符,得到目标答案文本。本申请无需人工对答案文本进行处理,而是采用自动化的方式生成目标答案文本,提升了答案文本的处理效率。尤其,在面对大量需要处理的答案文本时,无疑可以更快的完成处理。
-
公开(公告)号:CN117763412A
公开(公告)日:2024-03-26
申请号:CN202311708141.4
申请日:2023-12-12
Applicant: 科大讯飞股份有限公司
IPC: G06F18/241 , G06F40/295 , G06N3/0464 , G06N3/08
Abstract: 本申请公开了一种文字识别方法、识别模型训练方法和相关装置,该方法包括:获取待识别样本;将所述待识别样本输入至训练后的识别模型中的卷积模块,得到所述待识别样本对应的不同识别轮次的分类特征;将所述分类特征输入至所述识别模型中的分类模块,得到所述待识别样本对应的目标文本;其中,所述分类模块包括第一分类层和第二分类层,所述第一分类层对应有至少一个第一候选字符,所述第一候选字符包括占位符,所述第二分类层对应有多个区别于所述第一候选字符的第二候选字符。通过上述方式,本申请能够提高文字识别的效率和准确性。
-
公开(公告)号:CN114356201B
公开(公告)日:2024-02-20
申请号:CN202111592814.5
申请日:2021-12-23
Applicant: 科大讯飞股份有限公司
IPC: G06F3/0488 , G06F3/0354 , G06T5/70
Abstract: 本申请公开了一种书写美化方法、装置、设备和可读存储介质,该方法包括:采集多个书写轨迹点的信息,进行笔宽估计得到笔宽,并依次利用改进的三阶贝塞尔算法进行轨迹平滑得到多个插值轨迹点的信息,其中改进的三阶贝塞尔算法使用的控制点包括当前处理的书写轨迹点及其前三个书写轨迹点,多个插值轨迹点在当前处理的书写轨迹点之前的第一个书写轨迹点与第二个书写轨迹点之间,计算每个笔段的外轮廓,通过上述方式,每获取到一个书写轨迹点,就利用它更新改进的三阶贝塞尔算法的控制点,并对它之前的第一个书写轨迹点和第二个书写轨迹点之间进行平滑,能够降低电子屏书写平滑的延迟,也就能够降低电子屏书写美化的延迟。
-
公开(公告)号:CN112767318B
公开(公告)日:2023-07-25
申请号:CN202011642571.7
申请日:2020-12-31
Applicant: 科大讯飞股份有限公司
IPC: G06T7/00 , G06T7/90 , G06Q10/0639
Abstract: 本申请公开了一种图像处理效果的评价方法、装置、存储介质及设备,该方法包括:首先,获取待评价的目标图像处理效果,包括目标图像中文本行的文字涂抹图像、文本行的文字区域掩膜图像和文本行的颜色预测结果,然后,生成目标图像处理效果的评价指标,包括第一评价指标、第二评价指标、第三评价指标、第四评价指标以及第五评价指标中的至少一个,进而可以根据评价指标,确定目标图像处理效果的处理质量,可见,本申请在对目标图像处理效果的处理质量进行评价时,考虑了目标图像中文本行的文字涂抹图像、文本行的文字区域掩膜图像和文本行的颜色预测结果之间的关联关系,从而能够利用各个评价指标,自动且更准确地评价图像处理效果的处理质量。
-
公开(公告)号:CN116343235A
公开(公告)日:2023-06-27
申请号:CN202310141914.9
申请日:2023-02-13
Applicant: 科大讯飞股份有限公司
IPC: G06V30/226 , G06V30/18 , G06V10/80
Abstract: 本申请提供了文本的识别方法、装置、设备及存储介质,具体实现方案为:获取待识别文本的动态笔迹的点级轨迹信息和笔画级轨迹信息;利用所述点级轨迹信息和所述笔画级轨迹信息确定对应的轨迹点特征;基于所述轨迹点特征得到所述待识别文本的识别结果。根据本申请的技术方案,能够有效提升手写文本识别的准确性。
-
公开(公告)号:CN115587616A
公开(公告)日:2023-01-10
申请号:CN202211370044.4
申请日:2022-11-03
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种网络模型训练方法、装置、存储介质及计算机设备。该方法包括:获取目标任务的样本数据集,该样本数据集包括训练数据集和验证数据集,获取网络模型的结构搜索空间,根据训练数据集,利用元学习方式学习结构搜索空间中的多个不同第一子网络结构,以得到元学习方式所对应的元神经网络,并利用元神经网络生成结构搜索空间中的具有网络参数的多个不同第二子网络结构,利用验证数据集对多个不同第二子网络结构进行网络结构搜索,以确定目标任务的最优子网络结构,利用训练数据集对最优子网络结构进行训练,以得到目标任务所对应的网络模型,本申请可提高得到目标任务的网络模型的准确性和效率。
-
公开(公告)号:CN114220114A
公开(公告)日:2022-03-22
申请号:CN202111626108.8
申请日:2021-12-28
Applicant: 科大讯飞股份有限公司
IPC: G06V30/414 , G06K9/62
Abstract: 本申请公开了一种文本图像识别方法、装置、设备以及存储介质,该方法包括:获取文本图像,文本图像包括M个文本框,根据预先训练的检测模型,获取M个文本框中每个文本框的属性信息,根据M个文本框的属性信息,确定M个文本框中每个文本框的关联信息,根据M个文本框中每个文本框的属性信息和关联信息,确定文本图像的文本结构信息,文本结构信息包括M个文本框的排版结构和每个文本框的文本类别。从而,可准确地识别出文本图像的文本结构信息,提高了文本图像识别的适用性。
-
公开(公告)号:CN113628113A
公开(公告)日:2021-11-09
申请号:CN202110919966.5
申请日:2021-08-11
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种图像拼接方法及其相关设备,方法包括:在获取到待拼接图像之后,先对待拼接图像进行字符检测处理,得到待拼接图像的字符识别结果;再根据待拼接图像的字符识别结果和参考图像的字符识别结果,确定待拼接图像与参考图像之间的字符匹配结果;其中,参考图像与待拼接图像之间存在重叠区域;然后,依据待拼接图像与参考图像之间的字符匹配结果,确定待拼接图像的非重叠区域位置信息;最后,根据待拼接图像的非重叠区域位置信息,对包括参考图像的目标图像进行图像信息更新,以使更新后的目标图像不仅能够包括参考图像所携带的图像信息,也包括待拼接图像携带的图像信息,如此能够实现针对存在重叠区域的至少两个图像进行拼接处理。
-
公开(公告)号:CN110084229B
公开(公告)日:2021-10-08
申请号:CN201910228663.1
申请日:2019-03-25
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提供了一种印章检测方法、装置、设备及可读存储介质,首先获取待检测图像,然后从待检测图像中检测疑似印章区域,获得疑似印章区域集合,最后基于真实印章的固有特征,从疑似印章区域集合中确定真实印章区域。本申请提供的印章检测方法能够基于印章的固有特征自动对待检测图像进行印章检测,这种检测方式不但节省了人工成本,而且提高了印章检测效率,并且,本申请提供的印章检测方法具有较高的检测准确度。
-
公开(公告)号:CN112801088A
公开(公告)日:2021-05-14
申请号:CN202011640209.6
申请日:2020-12-31
Applicant: 科大讯飞股份有限公司
IPC: G06K9/32
Abstract: 本申请公开了一种扭曲文本行图像矫正的方法和相关装置,该方法包括:对扭曲文本行图像进行骨架提取和骨架拟合,获得扭曲文本行图像的骨架曲线公式;利用骨架曲线公式对扭曲文本行图像进行轮廓分割,获得扭曲文本行图像的轮廓曲线段;针对轮廓曲线段和轮廓曲线段上采样点,确定映射直线段和映射直线段上映射点;利用采样点至映射点的映射关系和预设映射变换算法,矫正扭曲文本行图像。可见,先通过扭曲文本行图像的骨架,将扭曲文本行图像的轮廓分为轮廓曲线段;再将轮廓曲线段映射为映射直线段,实现对扭曲文本行图像的矫正。该方式适用于大多数的、普通的扭曲文本行图像的矫正。
-
-
-
-
-
-
-
-
-