-
公开(公告)号:CN115457568B
公开(公告)日:2023-06-16
申请号:CN202211141204.8
申请日:2022-09-20
Applicant: 吉林大学
IPC: G06V30/164 , G06V30/42 , G06V30/19 , G06V30/148 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/0475 , G06N3/084
Abstract: 本申请公开了一种基于生成对抗网络的历史文档图像降噪方法及系统,获取历史文档图像,构建文字骨骼提取网络训练集和生成对抗网络训练集;基于文字骨骼提取网络训练集,构建文字骨骼提取网络,获得文字骨骼图像;基于生成对抗网络训练集和文字骨骼图像,构建生成对抗网络,获得图像降噪模型;训练图像降噪模型,基于训练好的图像降噪模型,获得历史文档噪声图像的降噪结果。解决了历史文档图像中对于复杂噪声的处理问题,使图像降噪质量得到显著提高,具有很强的利用价值。
-
公开(公告)号:CN115599918A
公开(公告)日:2023-01-13
申请号:CN202211360252.6
申请日:2022-11-02
Applicant: 吉林大学(CN)
IPC: G06F16/35 , G06F40/216 , G06F18/241 , G06N3/0464 , G06N3/047 , G06N3/084
Abstract: 本申请公开了一种基于图增强的互学习文本分类方法及系统,包括预处理待分类文本,得到文本图结构和文本序列;基于所述文本图结构,构建图文本分类模型;将所述文本序列输入预训练语言模型中;基于所述图文本分类模型和所述预训练语言模型,构建互学习框架;对所述互学习框架进行学习和更新,得到互学习文本分类结果。一种利用互学习方式的图文本分类模型与预训练语言模型有效结合的框架,基于图文本分类模型与预训练语言模型相结合,在一个框架下同时对两个基本模型进行优化;通过使用不同的学习率、学习次数克服两种不同模型收敛速度不匹配的问题。
-
公开(公告)号:CN110992309A
公开(公告)日:2020-04-10
申请号:CN201911082827.0
申请日:2019-11-07
Applicant: 吉林大学
Abstract: 本发明公开了一种基于深层信息传递网络的眼底图像分割方法,所述方法通过构建深层信息提取网络,以预处理的眼底图片训练构建的深层信息传递网络,为眼底图像分割提供更好的网络模型,拟合出眼底图像的视盘区域,提升图像分割的精度。本发明使用预训练网络对编码层进行初始化,训练得到与图像分割任务需求相关的网络,在网络中采用解码层网络模块,提升了分割精度;深层信息传递网络模块与特征图上下文提取模块相结合,将特征图的高维特征传递到最终输出的预测图,使解码路径信息丢失更少;对编码层的深层网络采用了空洞卷积,保持参数不变的情况下扩大了卷积核的感受野,提取了更全面的特征图信息。
-
公开(公告)号:CN110334226A
公开(公告)日:2019-10-15
申请号:CN201910340084.6
申请日:2019-04-25
Applicant: 吉林大学
Abstract: 本发明公开了一种融合特征分布熵的深度图像检索方法,所述深度图像检索方法在图像检索中,从图像中提取的特征向量所携带的信息丰富程度会影响图像的检索效果,本发明提出了融合特征分布熵的深度图像检索方法。该算法的核心思想是在R-MAC特征向量中加入特征分布熵将其作为R-MAC特征的补充,将特征分布熵与R-MAC特征通过加权求和的方式融合在一起,得到的特征向量具有区域分布信息和更强的描述能力,从而提升图像检索性能。
-
公开(公告)号:CN118456455A
公开(公告)日:2024-08-09
申请号:CN202410924776.6
申请日:2024-07-11
Applicant: 吉林大学
Abstract: 本发明公开了一种基于多模态大模型的家务助理机器人,属于机器人控制、自然语言处理、计算机视觉的交叉领域,包括:静态场景处理模块、动作模块和控制模块;静态场景处理模块用于扫描工作环境,并对工作环境进行3D建模;动作模块用于实现机器人的水平方向的运动,以及对物体的交互动作;控制模块用于控制动作模块的动作,并基于多模态大模型LLaVa‑13B构建监督模型,基于监督模型对动作进行评价,再基于评价结果对动作进行调整。本发明的机器人对家用场景的泛化能力更强,比如家用场景中对特定物体的捡取、擦拭清洁、整理等任务高效的执行,在积累特定任务数据后,扩展机器人的能力,极大的提高用户的生活幸福指数。
-
公开(公告)号:CN117593755B
公开(公告)日:2024-04-02
申请号:CN202410071885.8
申请日:2024-01-18
Applicant: 吉林大学
IPC: G06V30/28 , G06N3/0455 , G06N3/0464 , G06N3/08 , G06V10/82 , G06V30/164 , G06V30/19 , G06V30/242 , G06V30/262
Abstract: 本发明公开了一种基于骨架模型预训练的金文图像识别方法和系统,所述方法包括:采集金文文字图像,对所述金文文字图像进行预处理,得到待识别预处理图像;使用无标签古文图像对骨架模型进行预训练,得到训练后的骨架模型;将所述待识别预处理图像输入训练后的骨架模型、文字信息推理器和文字识别器中,得到待识别文字的识别结果。本发明克服了金文数据集中数据质量差,类别不均衡等问题,实现了金文图像识别。
-
公开(公告)号:CN117593755A
公开(公告)日:2024-02-23
申请号:CN202410071885.8
申请日:2024-01-18
Applicant: 吉林大学
IPC: G06V30/28 , G06N3/0455 , G06N3/0464 , G06N3/08 , G06V10/82 , G06V30/164 , G06V30/19 , G06V30/242 , G06V30/262
Abstract: 本发明公开了一种基于骨架模型预训练的金文图像识别方法和系统,所述方法包括:采集金文文字图像,对所述金文文字图像进行预处理,得到待识别预处理图像;使用无标签古文图像对骨架模型进行预训练,得到训练后的骨架模型;将所述待识别预处理图像输入训练后的骨架模型、文字信息推理器和文字识别器中,得到待识别文字的识别结果。本发明克服了金文数据集中数据质量差,类别不均衡等问题,实现了金文图像识别。
-
公开(公告)号:CN116542995A
公开(公告)日:2023-08-04
申请号:CN202310768905.2
申请日:2023-06-28
Applicant: 吉林大学
IPC: G06T7/11 , G06N3/0464 , G06V10/22 , G06V10/764 , G06V10/80
Abstract: 本申请公开了一种基于区域表示和视觉表示的视觉问答方法及系统,其中方法步骤包括:基于Faster R‑CNN模型学得的图像区域特征,为每张待问答图像构建图像区域特征图;基于图像区域特征图,生成邻居增强的区域表示;基于GRU模型学得的问题特征对邻居增强的区域表示进行指导,得到最终的视觉特征;基于区域表示、视觉特征和问题特征,得到预测答案,完成视觉问答。本申请为每张图像构建区域特征图,以表示该图像中所有区域之间的关联和特征。同时,基于带重启的随机行走方法,在区域特征图中学习邻域增强区域表示。此外,还提出一个问题指导的纵横双重注意力机制。机制以问题特征表示作为指导,从区域层面和特征层面增强区域表示。
-
公开(公告)号:CN116304063B
公开(公告)日:2023-07-21
申请号:CN202310564657.X
申请日:2023-05-19
Applicant: 吉林大学
IPC: G06F16/35 , G06F40/216 , G06F40/289 , G06F40/30 , G06F16/33
Abstract: 本发明公开了一种简单的情感知识增强提示调优的方面级情感分类方法,属于人工智能的自然语言处理领域,包括以下步骤:构建提示模板,将所述提示模板和待分类文本输入到预训练语言模型中进行预测,获得待分类文本对应的若干个词的预测概率;构建情感知识映射表达器,并对所述情感知识映射表达器中的若干个情感标签词进行优化,获得优化后的情感标签词;基于所述若干个词的预测概率,获得优化后的情感标签词的预测概率;通过所述情感知识映射表达器将所述优化后的情感标签词的预测概率映射到类别标签,获得类别标签的最终预测概率。本发明通过引入外部情感词库来提高情感标签词的语义表达能力,同时减少了由单个情感标签词引起的偏差。
-
公开(公告)号:CN116304063A
公开(公告)日:2023-06-23
申请号:CN202310564657.X
申请日:2023-05-19
Applicant: 吉林大学
IPC: G06F16/35 , G06F40/216 , G06F40/289 , G06F40/30 , G06F16/33
Abstract: 本发明公开了一种简单的情感知识增强提示调优的方面级情感分类方法,属于人工智能的自然语言处理领域,包括以下步骤:构建提示模板,将所述提示模板和待分类文本输入到预训练语言模型中进行预测,获得待分类文本对应的若干个词的预测概率;构建情感知识映射表达器,并对所述情感知识映射表达器中的若干个情感标签词进行优化,获得优化后的情感标签词;基于所述若干个词的预测概率,获得优化后的情感标签词的预测概率;通过所述情感知识映射表达器将所述优化后的情感标签词的预测概率映射到类别标签,获得类别标签的最终预测概率。本发明通过引入外部情感词库来提高情感标签词的语义表达能力,同时减少了由单个情感标签词引起的偏差。
-
-
-
-
-
-
-
-
-