-
公开(公告)号:CN114220114B
公开(公告)日:2025-02-28
申请号:CN202111626108.8
申请日:2021-12-28
Applicant: 科大讯飞股份有限公司
IPC: G06V30/414 , G06V30/19
Abstract: 本申请公开了一种文本图像识别方法、装置、设备以及存储介质,该方法包括:获取文本图像,文本图像包括M个文本框,根据预先训练的检测模型,获取M个文本框中每个文本框的属性信息,根据M个文本框的属性信息,确定M个文本框中每个文本框的关联信息,根据M个文本框中每个文本框的属性信息和关联信息,确定文本图像的文本结构信息,文本结构信息包括M个文本框的排版结构和每个文本框的文本类别。从而,可准确地识别出文本图像的文本结构信息,提高了文本图像识别的适用性。
-
公开(公告)号:CN113628113B
公开(公告)日:2024-07-23
申请号:CN202110919966.5
申请日:2021-08-11
Applicant: 科大讯飞股份有限公司
IPC: G06T3/4038 , G06T5/50 , G06V30/14 , G06V30/18 , G06V30/19 , G06V10/82 , G06N3/0464
Abstract: 本申请公开了一种图像拼接方法及其相关设备,方法包括:在获取到待拼接图像之后,先对待拼接图像进行字符检测处理,得到待拼接图像的字符识别结果;再根据待拼接图像的字符识别结果和参考图像的字符识别结果,确定待拼接图像与参考图像之间的字符匹配结果;其中,参考图像与待拼接图像之间存在重叠区域;然后,依据待拼接图像与参考图像之间的字符匹配结果,确定待拼接图像的非重叠区域位置信息;最后,根据待拼接图像的非重叠区域位置信息,对包括参考图像的目标图像进行图像信息更新,以使更新后的目标图像不仅能够包括参考图像所携带的图像信息,也包括待拼接图像携带的图像信息,如此能够实现针对存在重叠区域的至少两个图像进行拼接处理。
-
公开(公告)号:CN118230334A
公开(公告)日:2024-06-21
申请号:CN202410140968.8
申请日:2024-01-31
Applicant: 科大讯飞股份有限公司
IPC: G06V30/19 , G06V30/14 , G06V30/414 , G06V10/82 , G06F16/22 , G06N3/0464 , G06N3/08
Abstract: 本申请提出一种题库资源加工方法、装置、电子设备、存储介质及产品,该方法包括:对试题图像进行版面要素检测,确定试题图像对应的版面要素信息;版面要素信息包括:版面要素的类型、位置和内容;基于试题图像对应的版面要素信息和预先设置的阅读顺序,确定试题集合;试题集合中包括按照阅读顺序排序的试题题干和试题解答;基于试题集合中各个试题题干对应的版面要素信息和试题集合中各个试题解答对应的版面要素信息,确定各个试题题干与各个试题解答之间的匹配结果。采用本方案,能够对试题图像中的各个试题题干和试题解答进行自动匹配,提高了试题题干与试题解答之间的匹配效率,从而提高了题库资源的加工效率,减少了题库资源的加工成本。
-
公开(公告)号:CN112949653B
公开(公告)日:2024-04-16
申请号:CN202110204628.3
申请日:2021-02-23
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种文本识别方法以及电子设备、存储装置,其中,文本识别方法包括:获取待识别图像;其中,待识别图像内含有至少一个目标文本;对待识别图像进行特征提取,得到待识别图像的特征图;利用特征图进行目标检测,得到分别与至少一个目标文本对应的目标区域;识别目标区域中的目标文本和目标文本的文本类型。上述方案,能够提高文本识别的准确性。
-
公开(公告)号:CN112733855B
公开(公告)日:2024-04-09
申请号:CN202011615053.6
申请日:2020-12-30
Applicant: 科大讯飞股份有限公司
IPC: G06V30/148 , G06V30/18 , G06V30/146 , G06T7/13 , G06T7/187
Abstract: 本申请公开了一种表格结构化方法、表格恢复系统以及具有存储功能的装置。本申请的表格结构化方法充分利用深度学习方案得到单元格的位置信息和文字信息,准确挖掘表格线和单元格定点位置信息,从而获得准确的表格结构化。
-
公开(公告)号:CN117787212A
公开(公告)日:2024-03-29
申请号:CN202311630251.3
申请日:2023-11-29
Applicant: 科大讯飞股份有限公司 , 中国科学技术大学
IPC: G06F40/109 , G06N3/094 , G06N3/0475
Abstract: 本申请公开了一种个性化手写字体生成方法、模型训练方法及相关设备,用户可以书写任意少量文字并拍摄得到文字图像,获取用户书写的每个文字的骨架结构图,从中选取设定数量个文字的骨架结构图,利用图像风格提取器对选取的文字的骨架结构图进行处理得到用户书写的风格特征,利用内容参考字特征提取器对指定的内容参考字进行处理得到内容结构特征,将风格特征和内容结构特征进行融合,利用融合特征生成具有用户书写风格的个性化字体。本申请方案仅需要用户书写少量的文字来提取风格特征,进而可以生成大量的具有用户书写风格的个性化字体,既能够保证与用户书写风格的统一,又可以保证生成的字体结构的正确性,相比现有技术节约成本,提升效率。
-
公开(公告)号:CN116030827A
公开(公告)日:2023-04-28
申请号:CN202211677826.2
申请日:2022-12-26
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提供了一种乐谱的跟随方法、装置、设备及存储介质,具体实现方案为:获取目标对象演奏的音频数据;根据所述音频数据确定对应的音频特征;在所述音频特征与待演奏乐谱中指定音符对应的音符特征匹配的情况下,在所述待演奏乐谱中将所述指定音符的下一音符确定为待演奏音符。根据本申请的技术方案,能够实现乐谱的自动跟随。
-
公开(公告)号:CN115565189A
公开(公告)日:2023-01-03
申请号:CN202211353860.4
申请日:2022-10-31
Applicant: 科大讯飞股份有限公司
IPC: G06V30/32 , G06V30/14 , G06V30/148 , G06V30/19
Abstract: 本申请提出一种扫描图像识别方法、装置、电子设备及存储介质,方法包括:从采集的扫描图像中,确定有效边界图像帧;确定有效边界图像帧中的边界字符是否为有效字符,若为有效字符,则从目标图像中确定边界字符的第一字符边界作为切分位置;若为无效字符,则从目标图像中确定边界字符的第二字符边界作为切分位置;对按照切分位置从目标图像中切分得到的待识别图像进行字符识别,得到扫描结果。第一字符边界使得从目标图像中切分得到的待识别图像中包含边界字符,以避免有效字符漏扫,第二字符边界使得从目标图像中切分得到的待识别图像中不包含边界字符,以避免无效字符多扫,提高了扫描图像的准确度,继而提高了识别结果的准确率。
-
公开(公告)号:CN114356201A
公开(公告)日:2022-04-15
申请号:CN202111592814.5
申请日:2021-12-23
Applicant: 科大讯飞股份有限公司
IPC: G06F3/0488 , G06F3/0354 , G06T5/00
Abstract: 本申请公开了一种书写美化方法、装置、设备和可读存储介质,该方法包括:采集多个书写轨迹点的信息,进行笔宽估计得到笔宽,并依次利用改进的三阶贝塞尔算法进行轨迹平滑得到多个插值轨迹点的信息,其中改进的三阶贝塞尔算法使用的控制点包括当前处理的书写轨迹点及其前三个书写轨迹点,多个插值轨迹点在当前处理的书写轨迹点之前的第一个书写轨迹点与第二个书写轨迹点之间,计算每个笔段的外轮廓,通过上述方式,每获取到一个书写轨迹点,就利用它更新改进的三阶贝塞尔算法的控制点,并对它之前的第一个书写轨迹点和第二个书写轨迹点之间进行平滑,能够降低电子屏书写平滑的延迟,也就能够降低电子屏书写美化的延迟。
-
公开(公告)号:CN112733855A
公开(公告)日:2021-04-30
申请号:CN202011615053.6
申请日:2020-12-30
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种表格结构化方法、表格恢复系统以及具有存储功能的装置。本申请的表格结构化方法充分利用深度学习方案得到单元格的位置信息和文字信息,准确挖掘表格线和单元格定点位置信息,从而获得准确的表格结构化。
-
-
-
-
-
-
-
-
-