-
公开(公告)号:CN113392825B
公开(公告)日:2024-04-30
申请号:CN202110666915.6
申请日:2021-06-16
Applicant: 中国科学技术大学 , 科大讯飞股份有限公司
IPC: G06V30/14 , G06V30/146 , G06V30/18 , G06V30/19 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本申请公开了一种文本识别方法、装置、设备及存储介质,本申请获取待识别文本所在的图像区域对应的文本图片,进一步对于待识别的文本图片,对其提取至少两个不同方向上的图像特征,进而基于提取的至少两个不同方向上的图像特征,识别文本图片中包含的文本内容。由此可见,对于待识别的文本图片,鉴于其文本内容方向上的多样化,本申请在进行图像特征提取时强化了所提取的方向信息,也即,从两个及以上的不同方向对文本图片进行特征提取,使得提取的图像特征包含了文本图片中待识别文本的多个方向上的特征信息,在此基础上,基于提取的图像特征,能够更加准确的识别文本图片中所包含的文本内容,提高了文本识别的准确度。
-
公开(公告)号:CN113392825A
公开(公告)日:2021-09-14
申请号:CN202110666915.6
申请日:2021-06-16
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种文本识别方法、装置、设备及存储介质,本申请获取待识别文本所在的图像区域对应的文本图片,进一步对于待识别的文本图片,对其提取至少两个不同方向上的图像特征,进而基于提取的至少两个不同方向上的图像特征,识别文本图片中包含的文本内容。由此可见,对于待识别的文本图片,鉴于其文本内容方向上的多样化,本申请在进行图像特征提取时强化了所提取的方向信息,也即,从两个及以上的不同方向对文本图片进行特征提取,使得提取的图像特征包含了文本图片中待识别文本的多个方向上的特征信息,在此基础上,基于提取的图像特征,能够更加准确的识别文本图片中所包含的文本内容,提高了文本识别的准确度。
-
公开(公告)号:CN115761744A
公开(公告)日:2023-03-07
申请号:CN202211476510.7
申请日:2022-11-23
Applicant: 科大讯飞股份有限公司
IPC: G06V30/146 , G06V30/148 , G06N20/00
Abstract: 本发明提供了一种文本识别方法、翻译方法及相关设备,其中,文本识别方法包括获取目标文本行图像;基于目标文本行图像和预先训练得到的识别模型,确定目标文本行图像对应的编码序列,其中,识别模型采用多个语种的标注有编码序列的训练文本行图像训练得到,一语种的训练文本行图像标注的编码序列为按该语种对应的切分方式对该语种的训练文本行图像中的文本行进行切分得到文本单元序列中各文本单元分别对应的编码组成的序列;基于目标文本行图像对应的编码序列,确定目标文本行图像中的文本行内容。本发明提供的文本识别方法基于识别模型可实现多个语种的文本行图像中文本行内容的识别。
-
公开(公告)号:CN115565185A
公开(公告)日:2023-01-03
申请号:CN202211363223.5
申请日:2022-11-02
Applicant: 科大讯飞股份有限公司
IPC: G06V30/226
Abstract: 本申请提供了一种手写数据生成方法,装置、存储介质及电子设备,涉及图像处理技术领域。该方法包括:获取目标图像,目标图像中包括至少一个目标字符,至少一个目标字符的书写风格为第一书写风格;基于目标图像,确定至少一个目标字符各自对应的字形特征,字形特征用于表征目标字符的形体信息;基于至少一个目标字符各自对应的字形特征,分别对至少一个目标字符进行书写风格转换,得到至少一个目标字符各自对应的手写数据,至少一个目标字符各自对应的手写数据的书写风格为第二书写风格,本申请基于目标字符的字形特征,得到目标字符对应的第二书写风格的手写数据,提升了手写数据的书写风格的多样性。
-
公开(公告)号:CN115830615A
公开(公告)日:2023-03-21
申请号:CN202211639380.4
申请日:2022-12-20
Applicant: 科大讯飞股份有限公司
IPC: G06V30/262 , G06V30/242 , G06V30/246 , G06V10/82
Abstract: 本申请公开了一种文本识别方法、装置、设备及可读存储介质。该方案中,首先确定待识别的文本行,待识别的文本行中包含低频字符;然后,对文本行进行初步识别,得到初步文本识别结果;再对文本行中包含的低频字符进行识别,得到低频字符识别结果;最后,利用低频字符识别结果替换初步文本识别结果中的低频字符,得到最终文本识别结果。由于对文本行中包含的低频字符进行识别,得到低频字符识别结果的准确度高于初步文本识别结果中的低频字符的准确度,因此,利用低频字符识别结果替换初步文本识别结果中的低频字符,能够提升低频字符的识别效果。
-
公开(公告)号:CN114255159A
公开(公告)日:2022-03-29
申请号:CN202111571764.2
申请日:2021-12-21
Applicant: 科大讯飞股份有限公司
IPC: G06T3/00 , G06T11/60 , G06N3/04 , G06V10/774 , G06V10/82
Abstract: 本发明提供一种手写文本图像生成方法、装置、电子设备和存储介质,其中方法包括:获取内容图像和参考手写文本图像;基于所述参考手写文本图像所包含的参考书写风格,对所述内容图像进行风格迁移,得到目标手写文本图像,所述目标手写文本图像与所述内容图像的文本内容相同。本发明提供的手写文本图像生成方法、装置、电子设备和存储介质,有效的将参考手写文本图像的参考书写风格信息解耦出来,可以生成不同书写人的手写文本图像;另外,该方法可以生成包括多行文本的手写文本图像,相比于只能生成单个手写字符,然后进行拼接组成词或者句子的方式,有效提高了手写文本图像的生成效率和质量。
-
公开(公告)号:CN114254638A
公开(公告)日:2022-03-29
申请号:CN202111580309.9
申请日:2021-12-22
Applicant: 科大讯飞股份有限公司
IPC: G06F40/289 , G06V30/148 , G06F16/35
Abstract: 本发明提供一种天城文分词和识别方法、装置、电子设备和存储介质,其中分词方法包括:获取待分词的天城文文本的字符序列;基于所述字符序列中当前字符的类型以及所述当前字符之后的字符的类型,对所述当前字符及其之后的字符进行分词,并将分词所得子词中的最尾字符在所述字符序列中的下个字符更新为当前字符进行分词,直至分词完成。本发明实施例提供的天城文分词和识别方法、装置、电子设备和存储介质,在分析整理了基础单元结构的基础上,提出了适合天城文语言结构特性的分词规则,既考虑当前字符的类型,也考虑当前字符之后的字符的类型,由此确定字符序列中一段字符的语言结构,据此进行分词。
-
-
-
-
-
-