文本识别方法、装置、电子设备及存储介质

    公开(公告)号:CN117576704A

    公开(公告)日:2024-02-20

    申请号:CN202311476055.5

    申请日:2023-11-03

    Abstract: 本申请提出一种文本识别方法、装置、电子设备及存储介质,该方法包括:对待识别文本图像进行视觉特征提取,并对提取的视觉特征进行非自回归序列解码得到初始识别文本;对初始识别文本进行基于上下文的文本特征提取处理,得到初始识别文本的文本特征;对视觉特征和文本特征进行对齐融合处理,得到融合特征,并对融合特征进行非自回归序列解码,得到待识别数据对应的识别文本。采用本方案,对融合特征进行非自回归序列解码,并且融合特征是由视觉特征和包含上下文信息的文本特征融合得到的,提高了解码特征的特征量和特征丰富程度,通过融合特征捕获了不同文本特征之间的关联性,从而提高了解码过程中各个字符之间的关联性,能够提高解码准确度。

    文本识别方法及相关装置、设备和存储介质

    公开(公告)号:CN116935404A

    公开(公告)日:2023-10-24

    申请号:CN202310692381.3

    申请日:2023-06-09

    Abstract: 本申请公开了一种文本识别方法及相关装置、设备和存储介质,其中,文本识别方法包括:提取待识别图像的图像特征;基于图像特征执行如下第一解码操作:基于上一解码时刻的解码信息,从图像特征提取得到当前解码时刻的第一视觉特征;并基于当前解码时刻的第一视觉特征及上一解码时刻的解码信息,得到当前解码时刻的语言特征;及基于第一视觉特征和语言特征进行解码,得到当前解码时刻的解码字符;其中,解码信息包括解码字符、解码状态中至少一者,组合各个解码时刻的解码字符得到第一解码操作的候选识别文本;基于若干种解码操作各自的候选识别文本,得到待识别图像的目标识别文本。上述方案,能够提升文本识别的准确性,特别是在OOV上的准确性。

    表格识别方法及相关装置
    6.
    发明公开

    公开(公告)号:CN119992578A

    公开(公告)日:2025-05-13

    申请号:CN202510056895.9

    申请日:2025-01-14

    Abstract: 本申请提出一种表格识别方法及相关装置,涉及图像识别技术领域。该表格识别方法可以包括:提取表格图像的视觉特征;其中,所述视觉特征包括:表格行特征和表格列特征;基于所述表格行特征确定行线关键点,以及基于所述表格列特征确定列线关键点;基于所述行线关键点预测行分割线,以及基于所述列线关键点预测列分割线;基于预测得到的所述行分割线与所述列分割线,生成结构化表格。本申请提供的技术方案用于解决现有技术中表格识别准确性低的问题。

    错字识别方法、装置、设备和存储介质

    公开(公告)号:CN119649378A

    公开(公告)日:2025-03-18

    申请号:CN202411674214.7

    申请日:2024-11-21

    Abstract: 本申请公开了一种错字识别方法、装置、设备和存储介质,该方法包括:获取待识别文字的第一笔画序列、以及待识别文字对应的正确文字的第二笔画序列;对第一笔画序列和第二笔画序列进行笔画匹配,分别确定待识别文字中未成功匹配的第一差异笔画和正确文字中未成功匹配的第二差异笔画;利用错字识别模型基于第一差异笔画和第二差异笔画进行错字识别,确定待识别文字的目标识别结果,目标识别结果用于表征待识别文字是否为错字。通过上述方式,本申请能够提高错字识别的准确度。

    对焦纸面及作业学情采集方法、装置、设备及存储介质

    公开(公告)号:CN115174814B

    公开(公告)日:2024-06-04

    申请号:CN202210908066.5

    申请日:2022-07-29

    Abstract: 本申请公开了一种对焦纸面及作业学情采集方法、装置、设备及存储介质,本申请获取到对包含指定用户的手写体批注内容的纸质文档拍摄的图片,从中识别出手写体批注内容对应的目标区域,控制摄像头在不同焦距下对目标区域进行拍摄,分别确定每一焦距对应的目标区域图片中手写体批注内容的清晰度,并选取清晰度最高的焦距作为目标焦距,以便摄像头基于目标焦距进行后续的拍摄。本申请中考虑到对于作业学情采集这一任务,指定用户的手写体批注内容是最重要的信息,以不同焦距下拍摄的手写体批注内容的清晰度作为筛选条件确定目标焦距,保证按照该目标焦距拍摄的图片中指定用户的手写体批注内容是清晰的,提升后续对作业学情的采集的准确度。

    个性化手写字体生成方法、模型训练方法及相关设备

    公开(公告)号:CN117787212A

    公开(公告)日:2024-03-29

    申请号:CN202311630251.3

    申请日:2023-11-29

    Abstract: 本申请公开了一种个性化手写字体生成方法、模型训练方法及相关设备,用户可以书写任意少量文字并拍摄得到文字图像,获取用户书写的每个文字的骨架结构图,从中选取设定数量个文字的骨架结构图,利用图像风格提取器对选取的文字的骨架结构图进行处理得到用户书写的风格特征,利用内容参考字特征提取器对指定的内容参考字进行处理得到内容结构特征,将风格特征和内容结构特征进行融合,利用融合特征生成具有用户书写风格的个性化字体。本申请方案仅需要用户书写少量的文字来提取风格特征,进而可以生成大量的具有用户书写风格的个性化字体,既能够保证与用户书写风格的统一,又可以保证生成的字体结构的正确性,相比现有技术节约成本,提升效率。

    目标检测方法、装置、电子设备和存储介质

    公开(公告)号:CN117197433A

    公开(公告)日:2023-12-08

    申请号:CN202311157821.1

    申请日:2023-09-07

    Abstract: 本发明提供一种目标检测方法、装置、电子设备和存储介质,方法包括:获取视图图像,以及点云数据,视图图像和点云数据是针对同一空间采集得到的;基于点云数据,对视图图像进行深度预计和/或对空间下的鸟瞰图进行可见性分割,得到空间遮挡关系;基于空间遮挡关系,对视图图像和点云数据进行特征聚合,并基于聚合结果进行目标检测。本发明实施例提供的方法、装置,通过点云数据,对视图图像进行深度预计和/或对空间下的鸟瞰图进行可见性分割,得到空间遮挡关系,并应用空间遮挡关系指导视图图像和点云数据的特征聚合,从而避免聚合过程中反向投影的问题,避免在聚合过程中引入噪声,由此基于聚合结果进行目标检测,实现了准确可靠的目标检测。

Patent Agency Ranking