文本分块方法、装置、电子设备和存储介质

    公开(公告)号:CN114255466A

    公开(公告)日:2022-03-29

    申请号:CN202111570376.2

    申请日:2021-12-21

    Abstract: 本发明提供一种文本分块方法、装置、电子设备和存储介质,其中方法包括:对待分块的文本图像进行文本检测,得到文本图像中的各个文本行的位置;基于各个文本行的位置、各个文本行在文本图像中的区域图像,以及各个文本行的识别文本,对文本图像进行文本分块,得到文本分块结果,从三个不同的角度评估文本图像中各个文本行的语句完整性以及各个文本行之间的语义连贯性,据此评估结果进行文本分块,能够克服传统方案中直接对单个文本行进行翻译,使得翻译结果的准确度不高以及实际效果不佳的缺陷,本发明实施例中,能够将具有语义关系的文本行串联在一起,从而为后续翻译任务的执行以及翻译结果准确率和实际效果的提升提供强大的助力。

    作业学情采集方法、装置、设备及存储介质

    公开(公告)号:CN115147859B

    公开(公告)日:2025-01-03

    申请号:CN202210909939.4

    申请日:2022-07-29

    Abstract: 本申请公开了一种文本处理方法、装置、设备及存储介质,通过摄像头对审阅者批注纸质作业文档的场景进行拍摄,获取到拍摄的视频,进而对视频中每一视频帧进行识别,得到每一视频帧中包含的审阅者手写体批注内容以及作答者的身份信息,基于识别到的每一视频帧的作答者的身份信息,对拍摄的视频进行切分,得到与每一身份的作答者对应的视频帧序列,基于每一身份的作答者对应的视频帧序列中各视频帧包含的审阅者手写体批注内容,可以分析得到每一身份的作答者的作业学情。本申请提供的方案对于审阅者而言是无感的,不需要改变审阅者的批注流程和习惯,也不需要审阅者去手动对批注后的纸质作业文档进行拍照操作,因此降低审阅者的工作量。

    阅读顺序的确定方法及装置、电子设备及存储介质

    公开(公告)号:CN116030468A

    公开(公告)日:2023-04-28

    申请号:CN202211689264.3

    申请日:2022-12-27

    Abstract: 本申请提供了一种阅读顺序的确定方法及装置、电子设备及存储介质,涉及图像处理技术领域。该阅读顺序的确定方法包括:获取目标文本图像中包括的文本行集合,文本行集合中包括至少一个文本行;确定至少一个文本行各自的特征向量;基于至少一个文本行各自的特征向量,对文本行集合进行至少一次文本行解码操作,得到至少一个文本行各自的阅读排序信息;基于至少一个文本行各自的阅读排序信息,确定至少一个文本行对应的阅读顺序。通过对文本行集合中各个文本行的特征向量进行文本行解码操作,得到各个文本行的阅读排序信息,再通过该阅读排序信息确定各个文本行对应的阅读顺序,提高了所确定的文本行的阅读顺序的准确性。

    一种文本分块方法、图文翻译方法及相关设备

    公开(公告)号:CN115223184A

    公开(公告)日:2022-10-21

    申请号:CN202210830460.1

    申请日:2022-07-15

    Abstract: 本发明提供了一种文本分块方法、图文翻译方法及相关设备,其中,文本分块方法包括:获取目标图片中的若干文本行分别对应的文本行信息;根据目标图片、目标图片中的若干文本行分别对应的文本行信息,获取目标图片中的若干文本行分别对应的文本行特征;根据目标图片中的若干文本行分别对应的文本行特征,对目标图片中的若干文本行进行分块。本发明提供的文本分块方法可实现对图片中的若干文本行进行分块。在本发明提供的文本分块方法的基础上,本发明还提供了一种图文翻译方法,该翻译方法以文本块为单位进行翻译,由于一个文本块中的各文本行具有语义关系,因此,以文本块为单位进行翻译能够获得较为准确、连贯、通顺的译文。

    文本识别方法、装置、设备及存储介质

    公开(公告)号:CN113392825A

    公开(公告)日:2021-09-14

    申请号:CN202110666915.6

    申请日:2021-06-16

    Abstract: 本申请公开了一种文本识别方法、装置、设备及存储介质,本申请获取待识别文本所在的图像区域对应的文本图片,进一步对于待识别的文本图片,对其提取至少两个不同方向上的图像特征,进而基于提取的至少两个不同方向上的图像特征,识别文本图片中包含的文本内容。由此可见,对于待识别的文本图片,鉴于其文本内容方向上的多样化,本申请在进行图像特征提取时强化了所提取的方向信息,也即,从两个及以上的不同方向对文本图片进行特征提取,使得提取的图像特征包含了文本图片中待识别文本的多个方向上的特征信息,在此基础上,基于提取的图像特征,能够更加准确的识别文本图片中所包含的文本内容,提高了文本识别的准确度。

Patent Agency Ranking