-
公开(公告)号:CN117275008A
公开(公告)日:2023-12-22
申请号:CN202311140736.4
申请日:2023-09-05
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种基于圆形检测的高效鲁棒印章检测与文字识别方法,其步骤包括:1)基于圆检测的技术从待检测图片中获取候选印章区域;2)对所述候选印章区域进行拉直,将所述候选印章区域中的环形文字变水平后进行文字识别;3)利用印章中的图片对称性和文字特性,对所述候选印章区域进行过滤,得到该待检测图片中的印章区域,并输出所述印章区域中的文字。本发明鲁棒性更强,可检测出模糊彩色图像、黑白图像、含多个印章、残缺扭曲和光线不一致环境下的印章;且针对文字扭曲严重的印章,文字识别的最小编辑距离优于其他平台;本发明在不依靠GPU的条件下,极大提高了印章检测效率,且检测印章区域更为准确,减少了非印章区域的文字引入。
-
公开(公告)号:CN119600643A
公开(公告)日:2025-03-11
申请号:CN202411474911.8
申请日:2024-10-22
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种零样本图像分类方法及装置,属于图像识别领域。本发明通过大型语言模型生成类别描述文档,通过视觉编码器和文本编码器获取图像和文档的全局和局部特征信息,然后通过视觉语义分解模块和文本语义分解模块进行解耦,生成视觉语义嵌入和文本语义嵌入;通过上述模块的联合训练,并优化由局部到语义映射方差损失、多语义多样性损失、分解语义对齐损失和局部语义对齐损失组成的总损失;训练完成后用于推理阶段的图像类别预测。本发明可以降低零样本图像分类的难度,提高分类准确率和效率。
-
公开(公告)号:CN117453943A
公开(公告)日:2024-01-26
申请号:CN202311123147.5
申请日:2023-09-01
Applicant: 中国科学院信息工程研究所
IPC: G06F16/583 , G06V20/70 , G06V30/18 , G06V30/19 , G06V10/74 , G06V10/764
Abstract: 本发明公开了一种基于预训练跨模态检索的小样本多要素场景图像识别方法,其步骤包括:1)建立图像数据库,包括多个通用场景类别的图像和若干目标场景类别的图像,每一场景类别包括多个图像,每一图像设置对应的场景类别标签;2)利用场景识别模型提取图像数据库中每一场景类别图像的特征,得到每一场景类别对应的特征数据库;根据特征数据库中同一图像的特征生成一特征向量;3)对于一待类别识别的图像A,利用场景识别模型提取该图像A的特征并生成一特征向量;4)场景识别模型将该图像A的特征向量分别与各所述特征数据库中的特征向量进行相似度计算;将相似度最高的特征向量对应的图像的场景类别作为该图像A的场景类别。
-
-