-
公开(公告)号:CN113313064B
公开(公告)日:2024-08-23
申请号:CN202110698184.3
申请日:2021-06-23
申请人: 北京有竹居网络技术有限公司
IPC分类号: G06V30/414 , G06V30/14 , G06V30/19 , G06V10/82 , G06N3/0464 , G06N3/09
摘要: 本公开涉及一种字符识别方法、装置、可读介质及电子设备,该字符识别方法通过获取待识别文本图像中每个字符对应的字符文本区域图像,以及该待识别文本图像中的行区域图像;根据该字符文本区域图像,通过预先训练的预设字符识别模型得到该待识别文本图像对应的待定字符识别结果;并根据该行区域图像,以及该待定字符识别结果中该行区域图像对应的字符识别结果,通过预先训练的预设非自回归模型得到该待识别文本图像对应的目标字符识别结果。如此通过该预设非自回归模型以待定字符识别结果为预测依据,不仅能够有效提升字符识别效率,还能够结合上下文语义信息,提升字符识别结果的准确率。
-
公开(公告)号:CN113256660B
公开(公告)日:2024-07-26
申请号:CN202110628799.9
申请日:2021-06-04
申请人: 北京有竹居网络技术有限公司
IPC分类号: G06T7/11 , G06T7/187 , G06V30/148
摘要: 本公开实施例公开了图片处理方法、装置和电子设备。该方法的一具体实施方式包括:基于包括待处理图片的图片展示界面,获取与待处理图片相关的描述信息;根据描述信息,确定待处理图片中展示的目标物体的目标物体类型;根据所述目标物体类型,确定目标物体图像在待处理图片中的展示区域;基于所述展示区域,对所述待处理图片进行处理得到处理后图片。由此,可以提供一种新的图片处理方式。
-
公开(公告)号:CN113657369B
公开(公告)日:2024-05-24
申请号:CN202110988932.1
申请日:2021-08-26
申请人: 北京有竹居网络技术有限公司
摘要: 本申请公开了一种文字识别方法及其相关设备,该方法包括:在获取到包括长文本的待识别文本图像之后,先将该待识别文本图像按照预设切片参数进行第一切分处理,得到至少一个图像切片和该至少一个图像切片的位置信息;再根据该至少一个图像切片的单字检测结果以及位置信息,确定该待识别文本图像对应的实际切图位置;然后,按照该待识别文本图像对应的实际切图位置,对该待识别文本图像进行第二切分处理,得到至少一个待使用图片;最后,根据该至少一个待使用图片的文字识别结果,确定该待识别文本图像的文字识别结果,如此能够实现针对长文本的文字识别过程。
-
公开(公告)号:CN113657370B
公开(公告)日:2024-04-23
申请号:CN202110988943.X
申请日:2021-08-26
申请人: 北京有竹居网络技术有限公司
IPC分类号: G06V30/14 , G06V20/62 , G06V30/148 , G06V30/19
摘要: 本申请公开了一种文字识别方法及其相关设备,该方法包括:在获取到包括长文本的待识别文本图像之后,先根据该待识别文本图像的单字检测结果和该待识别文本图像对应的预设切图位置,确定该待识别文本图像对应的实际切图位置;再按照该实际切图位置对该待识别文本图像进行切分,得到至少一个待使用图片;最后,根据该至少一个待使用图片的文字识别结果,确定该待识别文本图像的文字识别结果,如此能够实现针对长文本的文字识别过程。可见,因单字检测结果能够准确地表示出该待识别文本图像中字符的位置信息,使得基于该单字检测结果确定的实际切图位置不会出现在字符内部,如此有利于提高长文本识别的识别准确性。
-
公开(公告)号:CN113256659B
公开(公告)日:2024-04-12
申请号:CN202110628798.4
申请日:2021-06-04
申请人: 北京有竹居网络技术有限公司
摘要: 本公开实施例公开了图片处理方法、装置和电子设备。该方法的一具体实施方式包括:对于预先确定的目标图片,沿所述目标图片的长边,进行滑窗分图获得至少两个子图,其中,目标图片的长边与短边的长度比值大于预设长度比值阈值;检测各个子图中是否包括文字;根据包括文字的子图在所获得的子图中的比例,对所述目标图片进行处理得到对应的处理后图片。由此,提供了一种新的图片处理方式。
-
公开(公告)号:CN113435528B
公开(公告)日:2024-02-02
申请号:CN202110763438.5
申请日:2021-07-06
申请人: 北京有竹居网络技术有限公司
IPC分类号: G06F18/241 , G06F18/214
摘要: 本公开涉及一种对象分类的方法、装置、可读介质和电子设备,该方法包括:获取包含待分类对象的对象信息以及待分类对象对应的目标任务,对象信息包括图像信息、视频信息、文本信息和音频信息中的至少一种,根据对象信息和目标任务,通过联合分类模型,确定待分类对象对应的分类结果,其中,联合分类模型是利用多个分类任务对应的目标样本集,对多任务分类模型进行更新后得到的模型,目标样本集是根据每个分类任务对应的单任务模型和该分类任务对应的数据样本集确定的,每个分类任务对应的单任务模型为根据该分类任务对应的数据样本集进行模型训练得到的模型,多任务分类模型为根据多个分类任务对应的数据样本集进行模型训练得到的模型。
-
公开(公告)号:CN113220922B
公开(公告)日:2024-02-02
申请号:CN202110628560.1
申请日:2021-06-04
申请人: 北京有竹居网络技术有限公司
IPC分类号: G06F16/58 , G06F16/53 , G06F16/538 , G06F16/583 , G06N3/045 , G06N3/08
摘要: 本公开实施例公开了图像搜索方法、装置和电子设备。该方法的一具体实施方式包括:获取用于搜索图像的目标查询信息;基于候选图像与所述目标查询信息的去偏相关度,生成所述目标查询信息对应的目标查询结果;其中,去偏相关度通过第一步骤生成,所述第一步骤包括:根据历史查询信息对应的用户选中日志,确定候选图像的后验选中概率;基于预设的后验选中概率与去偏相关度和视觉吸引度这两者之间的关系,生成候选图像与历史查询信息的去偏相关度。由此,提供了一种新的图像搜索方式。
-
公开(公告)号:CN113033580B
公开(公告)日:2024-02-02
申请号:CN202110351439.9
申请日:2021-03-31
申请人: 北京有竹居网络技术有限公司
摘要: 本公开涉及一种图像处理方法、装置、存储介质及电子设备,提供支持变长特征的自适应池化方式,减少图像处理过程中池化操作所需的人力和时间,提高图像池化效率,进而提高图像处理效率。该图像处理方法包括:获取待处理的目标图像中对应的目标图像特征;确定长度与所述目标图像特征长度一致的位置向量,所述位置向量包括依次排列的多个位置编号;将所述位置向量转换为二维的位置编码向量;根据所述位置编码向量和序列模型确定所述目标图像特征的池化系数;将所述池化系数与所述目标图像特征进行点乘,以得到所述目标图像的图像池化结果。
-
公开(公告)号:CN114283403B
公开(公告)日:2024-01-16
申请号:CN202111604840.5
申请日:2021-12-24
申请人: 北京有竹居网络技术有限公司
IPC分类号: G06V20/62 , G06V10/28 , G06V10/34 , G06V10/50 , G06V10/46 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/08
摘要: 本申请公开了一种图像检测方法、装置、存储介质及设备,该方法包括:首先对获取到的目标图像进行检测,得到包含单字符位置的二值图,然后对该二值图进行转换处理,得到目标图像对应的β骨架图;接着,将该β骨架图输入预先构建的图神经网络预测模型,预测得到β骨架图中各个图节点之间的边的分类结果,进而可以利用分类结果对β骨架图进行更新,并根据更新结果对目标图像进行检测,得到对应的文本检测结果。可见,由于本申请是先利用β骨架图表征目标图像中各个单字符的关联关系,然后通过预先构建的图神经网络预测模型确定出β骨架图中各个边的分类结果,进而实现了基于单字符检测的文本行或单词粒度的检测结果,从而提高了
-
公开(公告)号:CN112766284B
公开(公告)日:2023-11-21
申请号:CN202110105991.X
申请日:2021-01-26
申请人: 北京有竹居网络技术有限公司
IPC分类号: G06V10/764 , G06V10/44 , G06N7/01
-
-
-
-
-
-
-
-
-