-
-
公开(公告)号:CN119741582A
公开(公告)日:2025-04-01
申请号:CN202411544206.0
申请日:2024-10-31
Applicant: 桂林电子科技大学
IPC: G06V10/82 , G06V10/42 , G06V10/44 , G06V10/70 , G06V10/771 , G06V10/80 , G06N3/0455 , G06N3/0464 , G06N3/08
Abstract: 本发明公开一种基于视觉特征与文本特征多层次交互的图像描述生成方法及装置,该方法步骤包括:获取待描述图像,分别提取出图像的区域特征以及网格特征,输入至基于Transformer架构的特征增强编码器中进行特征提取,进行融合后得到最终的增强图像特征;将获取的待描述图像裁剪成不同大小的多个子图像,并对每个子图像进行检索得到不同大小的子图像的文本描述;将各子图像文本描述分别与所述增强图像特征映射至同一语义空间并进行多层次交互,以基于多层语义指导实现语义信息与视觉特征的校准得到校准后的全局特征;对校准后的全局特征进行解码,得到最终的图像描述结果。本发明能够准确理解图像上下文场景,生成准确、丰富的描述。
-
公开(公告)号:CN118762356A
公开(公告)日:2024-10-11
申请号:CN202410861066.3
申请日:2024-06-28
Applicant: 桂林电子科技大学
Abstract: 本发明公开一种融合边缘信息与文本增强的越南语场景文本检测方法及装置,该方法步骤包括:S01.将待测图像输入至主干网络提取出多层特征,以及由EIEM模块基于通道注意力机制提取得到边缘细节信息,将文本边缘细节信息与第一层特征融合;S02.将从主干网络中提取出的顶层特征输入至TREM模块,分别提取全局上下文信息以及字符间的依赖关系,根据TREM模块输出的特征对从主干网络提取出的各层特征进行调节,融合不同层的特征图形成文本区域增强后的特征图;S03.进行文本后处理,得到概率图和自适应阈值图,进行可变二值化操作,得到近似二值图以确定文本框的边界。本发明具有实现方法简单、检测精度高且鲁棒性强等优点。
-
公开(公告)号:CN117315448A
公开(公告)日:2023-12-29
申请号:CN202311345540.9
申请日:2023-10-17
Applicant: 桂林电子科技大学
IPC: G06V10/86 , G06V10/44 , G06V10/82 , G06N3/0442 , G06N3/048
Abstract: 本发明公开一种融合物体位置关系的图像描述方法及装置,该方法包括以下步骤:S1.输入待描述图像,提取待描述图像的全局特征信息以及候选框特征信息;S2.根据提取特征信息构建物体关系场景图;S3.对物体关系场景图中包含的各类节点信息进行初次编码;如果物体关系场景图中物体节点间位置关系比例与物体的原始位置关系相比存在比例失衡现象,则根据比例失衡程度对节点信息初次编码得到的物体关系编码特征矩阵进行二次编码;S4.将编码后的物体关系场景图以及节点信息输入至联合解码器中进行联合解码,预测出待描述图像的文本信息。本发明能够充分融合图像中物体位置关系,实现高效、精准的图像描述。
-
公开(公告)号:CN108920544A
公开(公告)日:2018-11-30
申请号:CN201810609066.9
申请日:2018-06-13
Applicant: 桂林电子科技大学
Abstract: 本发明公开了一种基于知识图谱的个性化职位推荐方法,包括:获取求职招聘领域数据,获取求职者的简历信息,对求职招聘领域数据进行规范化处理;之后进行知识抽取,融合,形成结构化的求职招聘领域知识;将获取的结构化的求职招聘领域知识存入图数据库,构建求职招聘领域知识图谱;构建基于知识图谱的个性化职位推荐模型;读取求职者的简历信息,基于上述知识图谱对简历信息中某些属性进行映射;基于上述知识图谱,根据上述职位推荐模型对职位按行业类别进行过滤,形成待推荐职位列表;针对待推荐职位列表,对简历信息和职位信息中的相应属性进行量化;计算简历信息和职位信息的相似度,筛选出与求职者简历相似度最高的前N个职位生成职位推荐列表,并推荐给求职者。
-
-
-
-