-
公开(公告)号:CN115761744A
公开(公告)日:2023-03-07
申请号:CN202211476510.7
申请日:2022-11-23
Applicant: 科大讯飞股份有限公司
IPC: G06V30/146 , G06V30/148 , G06N20/00
Abstract: 本发明提供了一种文本识别方法、翻译方法及相关设备,其中,文本识别方法包括获取目标文本行图像;基于目标文本行图像和预先训练得到的识别模型,确定目标文本行图像对应的编码序列,其中,识别模型采用多个语种的标注有编码序列的训练文本行图像训练得到,一语种的训练文本行图像标注的编码序列为按该语种对应的切分方式对该语种的训练文本行图像中的文本行进行切分得到文本单元序列中各文本单元分别对应的编码组成的序列;基于目标文本行图像对应的编码序列,确定目标文本行图像中的文本行内容。本发明提供的文本识别方法基于识别模型可实现多个语种的文本行图像中文本行内容的识别。
-
公开(公告)号:CN115565185A
公开(公告)日:2023-01-03
申请号:CN202211363223.5
申请日:2022-11-02
Applicant: 科大讯飞股份有限公司
IPC: G06V30/226
Abstract: 本申请提供了一种手写数据生成方法,装置、存储介质及电子设备,涉及图像处理技术领域。该方法包括:获取目标图像,目标图像中包括至少一个目标字符,至少一个目标字符的书写风格为第一书写风格;基于目标图像,确定至少一个目标字符各自对应的字形特征,字形特征用于表征目标字符的形体信息;基于至少一个目标字符各自对应的字形特征,分别对至少一个目标字符进行书写风格转换,得到至少一个目标字符各自对应的手写数据,至少一个目标字符各自对应的手写数据的书写风格为第二书写风格,本申请基于目标字符的字形特征,得到目标字符对应的第二书写风格的手写数据,提升了手写数据的书写风格的多样性。
-
公开(公告)号:CN117763412A
公开(公告)日:2024-03-26
申请号:CN202311708141.4
申请日:2023-12-12
Applicant: 科大讯飞股份有限公司
IPC: G06F18/241 , G06F40/295 , G06N3/0464 , G06N3/08
Abstract: 本申请公开了一种文字识别方法、识别模型训练方法和相关装置,该方法包括:获取待识别样本;将所述待识别样本输入至训练后的识别模型中的卷积模块,得到所述待识别样本对应的不同识别轮次的分类特征;将所述分类特征输入至所述识别模型中的分类模块,得到所述待识别样本对应的目标文本;其中,所述分类模块包括第一分类层和第二分类层,所述第一分类层对应有至少一个第一候选字符,所述第一候选字符包括占位符,所述第二分类层对应有多个区别于所述第一候选字符的第二候选字符。通过上述方式,本申请能够提高文字识别的效率和准确性。
-
公开(公告)号:CN115880700A
公开(公告)日:2023-03-31
申请号:CN202211638415.2
申请日:2022-12-19
Applicant: 科大讯飞股份有限公司
IPC: G06V30/32 , G06V30/148 , G06V30/19 , G06N20/00
Abstract: 本发明提供了一种书写内容识别方法、装置、设备及存储介质,其中,方法包括:获取书写轨迹点序列,并将书写轨迹点序列渲染成书写内容图像;根据书写轨迹点序列和书写内容图像,从书写内容图像中分割出若干子图像,并确定若干子图像分别对应的属性,一子图像为书写内容图像中一种属性的书写内容的图像,一子图像对应的属性为该子图像中书写内容的属性;针对每个子图像,采用该子图像对应的属性所对应的识别方法,对该子图像中的书写内容进行识别,得到该子图像对应的书写内容识别结果;根据若干子图像分别对应的书写内容识别结果,生成最终的书写内容识别结果。本发明提供的书写内容识别方法可实现多种属性的书写内容的混合识别。
-
公开(公告)号:CN115587616A
公开(公告)日:2023-01-10
申请号:CN202211370044.4
申请日:2022-11-03
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种网络模型训练方法、装置、存储介质及计算机设备。该方法包括:获取目标任务的样本数据集,该样本数据集包括训练数据集和验证数据集,获取网络模型的结构搜索空间,根据训练数据集,利用元学习方式学习结构搜索空间中的多个不同第一子网络结构,以得到元学习方式所对应的元神经网络,并利用元神经网络生成结构搜索空间中的具有网络参数的多个不同第二子网络结构,利用验证数据集对多个不同第二子网络结构进行网络结构搜索,以确定目标任务的最优子网络结构,利用训练数据集对最优子网络结构进行训练,以得到目标任务所对应的网络模型,本申请可提高得到目标任务的网络模型的准确性和效率。
-
公开(公告)号:CN114255159A
公开(公告)日:2022-03-29
申请号:CN202111571764.2
申请日:2021-12-21
Applicant: 科大讯飞股份有限公司
IPC: G06T3/00 , G06T11/60 , G06N3/04 , G06V10/774 , G06V10/82
Abstract: 本发明提供一种手写文本图像生成方法、装置、电子设备和存储介质,其中方法包括:获取内容图像和参考手写文本图像;基于所述参考手写文本图像所包含的参考书写风格,对所述内容图像进行风格迁移,得到目标手写文本图像,所述目标手写文本图像与所述内容图像的文本内容相同。本发明提供的手写文本图像生成方法、装置、电子设备和存储介质,有效的将参考手写文本图像的参考书写风格信息解耦出来,可以生成不同书写人的手写文本图像;另外,该方法可以生成包括多行文本的手写文本图像,相比于只能生成单个手写字符,然后进行拼接组成词或者句子的方式,有效提高了手写文本图像的生成效率和质量。
-
公开(公告)号:CN114254638A
公开(公告)日:2022-03-29
申请号:CN202111580309.9
申请日:2021-12-22
Applicant: 科大讯飞股份有限公司
IPC: G06F40/289 , G06V30/148 , G06F16/35
Abstract: 本发明提供一种天城文分词和识别方法、装置、电子设备和存储介质,其中分词方法包括:获取待分词的天城文文本的字符序列;基于所述字符序列中当前字符的类型以及所述当前字符之后的字符的类型,对所述当前字符及其之后的字符进行分词,并将分词所得子词中的最尾字符在所述字符序列中的下个字符更新为当前字符进行分词,直至分词完成。本发明实施例提供的天城文分词和识别方法、装置、电子设备和存储介质,在分析整理了基础单元结构的基础上,提出了适合天城文语言结构特性的分词规则,既考虑当前字符的类型,也考虑当前字符之后的字符的类型,由此确定字符序列中一段字符的语言结构,据此进行分词。
-
公开(公告)号:CN115174814B
公开(公告)日:2024-06-04
申请号:CN202210908066.5
申请日:2022-07-29
Applicant: 科大讯飞股份有限公司
IPC: H04N23/67
Abstract: 本申请公开了一种对焦纸面及作业学情采集方法、装置、设备及存储介质,本申请获取到对包含指定用户的手写体批注内容的纸质文档拍摄的图片,从中识别出手写体批注内容对应的目标区域,控制摄像头在不同焦距下对目标区域进行拍摄,分别确定每一焦距对应的目标区域图片中手写体批注内容的清晰度,并选取清晰度最高的焦距作为目标焦距,以便摄像头基于目标焦距进行后续的拍摄。本申请中考虑到对于作业学情采集这一任务,指定用户的手写体批注内容是最重要的信息,以不同焦距下拍摄的手写体批注内容的清晰度作为筛选条件确定目标焦距,保证按照该目标焦距拍摄的图片中指定用户的手写体批注内容是清晰的,提升后续对作业学情的采集的准确度。
-
公开(公告)号:CN113392825B
公开(公告)日:2024-04-30
申请号:CN202110666915.6
申请日:2021-06-16
Applicant: 中国科学技术大学 , 科大讯飞股份有限公司
IPC: G06V30/14 , G06V30/146 , G06V30/18 , G06V30/19 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本申请公开了一种文本识别方法、装置、设备及存储介质,本申请获取待识别文本所在的图像区域对应的文本图片,进一步对于待识别的文本图片,对其提取至少两个不同方向上的图像特征,进而基于提取的至少两个不同方向上的图像特征,识别文本图片中包含的文本内容。由此可见,对于待识别的文本图片,鉴于其文本内容方向上的多样化,本申请在进行图像特征提取时强化了所提取的方向信息,也即,从两个及以上的不同方向对文本图片进行特征提取,使得提取的图像特征包含了文本图片中待识别文本的多个方向上的特征信息,在此基础上,基于提取的图像特征,能够更加准确的识别文本图片中所包含的文本内容,提高了文本识别的准确度。
-
公开(公告)号:CN115830615A
公开(公告)日:2023-03-21
申请号:CN202211639380.4
申请日:2022-12-20
Applicant: 科大讯飞股份有限公司
IPC: G06V30/262 , G06V30/242 , G06V30/246 , G06V10/82
Abstract: 本申请公开了一种文本识别方法、装置、设备及可读存储介质。该方案中,首先确定待识别的文本行,待识别的文本行中包含低频字符;然后,对文本行进行初步识别,得到初步文本识别结果;再对文本行中包含的低频字符进行识别,得到低频字符识别结果;最后,利用低频字符识别结果替换初步文本识别结果中的低频字符,得到最终文本识别结果。由于对文本行中包含的低频字符进行识别,得到低频字符识别结果的准确度高于初步文本识别结果中的低频字符的准确度,因此,利用低频字符识别结果替换初步文本识别结果中的低频字符,能够提升低频字符的识别效果。
-
-
-
-
-
-
-
-
-