-
公开(公告)号:CN119741236A
公开(公告)日:2025-04-01
申请号:CN202510246464.9
申请日:2025-03-04
Applicant: 厦门理工学院
IPC: G06T5/77 , G06T3/4038 , G06N3/0455 , G06N3/08 , G06T5/70 , G06T5/60 , G06F17/14
Abstract: 本发明提供了一种甲骨文图像修复方法、装置,涉及图像处理技术领域,本方法通过在频率域中混合不同特征生成挑战性新图像,增强模型泛化能力;其包括训练初始修复模型,设计频带混合模块和掩码生成网络,混合甲骨文图像及其修复版本生成新图像,并以此训练和更新模型。该方法能有效提升甲骨文图像修复的质量,保留文字细节,增强模型鲁棒性;旨在解决甲骨文图像数据稀缺导致的模型泛化能力不足问题。
-
公开(公告)号:CN119722498A
公开(公告)日:2025-03-28
申请号:CN202510220613.4
申请日:2025-02-27
Applicant: 厦门理工学院
IPC: G06T5/60 , G06T5/70 , G06T5/73 , G06N3/0464 , G06N3/045 , G06N3/0442 , G06N3/0499 , G06V10/44 , G06V10/42 , G06V10/52 , G06V10/77 , G06V10/80 , G06V10/82 , G06N3/048
Abstract: 基于深层特征的医学图像增强方法、装置、设备和介质,涉及图像处理技术领域。其包含步骤S1至步骤S6。S1、获取低分辨率医学图像。S2、将低分辨率医学图像输入作为浅层特征提取模块的初始卷积层,生成初步浅层特征。S3、将初步浅层特征输入第一Mamba模块,获取增强浅层特征。S4、将增强浅层特征输入深特征提取模块,在深特征提取模块中经过重复#imgabs0#次的残差组的处理生成深层特征表示。S5、深层特征表示通过一个卷积层后与初始卷积层输出的增强浅层特征进行跳跃连接。S6、跳跃连接后的特征表示,再经过一个卷积层和第二Mamba模块,然后输入到图像重建模块通过像素重排操作进行上采样,并使用卷积层处理,生成高分辨率医学图像。
-
公开(公告)号:CN119132335B
公开(公告)日:2025-02-25
申请号:CN202411364648.7
申请日:2024-09-29
Applicant: 厦门理工学院
Abstract: 本发明提供了关于音频信息混淆可逆对抗样本的隐私保护方法、装置,本方法提出了一种名为“信息混淆可逆对抗性示例”的新框架。该框架能够在保证音频隐私安全的同时,确保在获得授权的情况下恢复音频的原始质量。通过采用本发明的方法,可以大幅度提升音频数据的安全性和隐私保护水平,有效防止未授权访问及分析。旨在解决现有技术中音频数据隐私保护存在的对抗性攻击容易被检测到、音频经过处理后质量下降明显,以及现有的可逆对抗性示例(RAE)技术在音频应用场景中的局限性的问题。
-
公开(公告)号:CN119229220B
公开(公告)日:2025-02-18
申请号:CN202411746649.8
申请日:2024-12-02
Applicant: 厦门理工学院
IPC: G06V10/764 , G06V10/82 , G06V10/774 , G06N3/096
Abstract: 本发明提供了基于跨域截断式迁移学习的放大内镜图像病变分类方法,包括获取放大内镜的真实图像、病变类别,构建训练、验证和测试数据集;构建基于跨域截断式迁移学习的放大内镜图像病变分类模型,设置截断点后进行训练,得到训练后的放大内镜图像病变分类模型;利用验证数据集对模型进行评估,根据验证结果调整模型参数,确定最终的模型;利用测试数据集进行测试,将经过测试的放大内镜图像病变分类模型应用于实际的放大内镜图像病变分类任务中。该方法适用于关于放大内镜图片病变类别工作,在模型训练过程中利用分层截断策略以及动态学习率调整机制,提升了模型的分类精度和训练效率,具有较强的实用性和推广价值。
-
公开(公告)号:CN118898847B
公开(公告)日:2025-01-17
申请号:CN202411390566.X
申请日:2024-10-08
Applicant: 厦门理工学院
IPC: G06V30/16 , G06V30/18 , G06V10/82 , G06N3/0464
Abstract: 本发明提出一种基于注意力导向细节修复的文档图像阴影去除方法,包括以下步骤;步骤S1、利用YCbCr颜色空间变换和亮度信息生成阴影注意力图作为标签,以识别阴影区域;步骤S2、通过阴影注意力生成子网络,采用多尺度大核注意力机制,提取阴影特征,获得最优注意力图;步骤S3、对所述最优注意力图和阴影特征进行动态融合;步骤S4、通过细节细化子网络,采用轻量级空间通道卷积计算并恢复图像细节;步骤S5、基于损失函数,通过端到端训练优化网络参数;步骤S6、使用训练完成的网络对文档图像进行阴影去除处理。旨在有效去除文档图像中的复杂阴影,同时保留图像细节,并以较低的计算复杂度实现。
-
公开(公告)号:CN119251852A
公开(公告)日:2025-01-03
申请号:CN202411774132.X
申请日:2024-12-05
Applicant: 厦门理工学院
Abstract: 一种基于多模态大模型的甲骨文字图像识别方法、装置、设备和介质,涉及计算机视觉技术领域。其中,这种甲骨文字图像识别方法首先,从OBIMD数据集提取甲骨文单字图像,并从镜原甲骨平台检索基础信息,形成单字数据集。接着,利用大语言模型生成包含文字释义等信息的第一对话数据集,并对Qwen2VL模型进行微调,得到初始识别模型。然后,通过位置信息对话数据集进行第二微调,获得定位顺序识别模型,该模型能识别字符并完成定位标注。进一步,生成现代汉语翻译对话数据集,并对模型进行第三微调,得到语义识别模型,能组合字符成句并翻译。最后,输入待识别甲骨图像,模型根据图像是单字或多字,分别输出字符标识、释义或组合句子并翻译成现代汉语。
-
公开(公告)号:CN119228940A
公开(公告)日:2024-12-31
申请号:CN202411774131.5
申请日:2024-12-05
Applicant: 厦门理工学院
IPC: G06T11/00 , G06V10/774 , G06N3/0455 , G06N3/0464 , G06N3/0475 , G06N3/084
Abstract: 本发明提供了一种基于病理信息引导的扩散模型放大内镜图像生成方法,包括获取放大内镜的真实图像、Mask图像和病理信息文本提示,构建训练、测试数据集;构建基于病理信息引导的放大内镜图像生成模型通过训练数据集进行训练,得到训练好的放大内镜图像生成模型;利用测试数据集进行测试,评估其在未知数据上的性能,评估合格的即为最终得到的放大内镜图像生成模型;将最终得到的放大内镜图像生成模型应用于放大内镜图像生成工作,获取模型生成的放大内镜图像。该方法适用于关于放大内镜图片生成工作,利用病理信息和背景Mask图片引导的方式来精准生成不同病理的放大内镜图片,有效的解决了关于放大内镜图片下游分割和分类任务的数据不平衡问题。
-
公开(公告)号:CN119206279A
公开(公告)日:2024-12-27
申请号:CN202411729686.8
申请日:2024-11-29
Applicant: 厦门理工学院
IPC: G06V10/762 , G06V10/774 , G06V10/74 , G06V10/80 , G06V10/82 , G06N3/0455 , G06N3/0442 , G06N3/0464 , G06N3/084
Abstract: 本发明提供的一种基于不确定性与图神经网络的多视图聚类方法,涉及多视图聚类技术领域。本发明通过获取多视图数据集,进行预处理后,得到原始特征矩阵与邻接矩阵;对输入的所述原始特征矩阵和所述邻接矩阵进行特征提取与融合后,得到一致嵌入矩阵与转移矩阵;基于Dempster‑Shafer证据理论与狄利克雷分布,通过降低所述一致嵌入矩阵中嵌入空间的不确定性,得到可靠一致嵌入;将所述可靠一致嵌入与所述转移矩阵映射为最终嵌入;对所述最终嵌入进行解码重建与聚类分析,得到聚类结果。本发明能充分挖掘视图中的潜在信息,降低模型中的不确定性,解决了多视图聚类任务中存在的噪声问题,能够快速、高效、准确地得到多视图数据的聚类结果。
-
公开(公告)号:CN119204096A
公开(公告)日:2024-12-27
申请号:CN202411707990.2
申请日:2024-11-27
Applicant: 厦门理工学院
IPC: G06N3/042 , G06N3/084 , G06F18/214 , G06F18/2415
Abstract: 本发明提供的一种基于稀疏与远邻节点增强的图表示学习方法,涉及数据增强技术领域。本发明根据获取的待增强的图结构数据集,得到初始节点特征矩阵、邻接矩阵与原始分类标签,并划分训练集与测试集;利用特征增强技术对训练集的节点特征进行强化,得到稀疏增强图结构数据集;然后结合节点混合技术,通过对类内节点和类间节点进行特征和分类标签的混合,以增加远邻节点的可达性,得到远邻增强图结构数据集;将远邻增强图结构数据集输入图神经网络模型进行图表示学习与训练,从而得到最优的节点表示与训练好的图表示学习模型;最后经模型测试评估,得到评估好的模型。本发明解决了传统图神经网络在处理稀疏节点和远邻节点信息聚合时的不足。
-
公开(公告)号:CN118711191A
公开(公告)日:2024-09-27
申请号:CN202410510028.3
申请日:2024-04-26
Applicant: 厦门理工学院 , 福建火炬电子科技股份有限公司
IPC: G06V30/16 , G06V30/14 , G06V30/148 , G06V30/18 , G06V30/19 , G06V30/41 , G06V10/82 , G06N3/0464 , G06N3/0455 , G06N3/084 , G06N3/048
Abstract: 本发明提出一种应用于扭曲文档的文档图像校正方法及其装置,包括:构建并训练获得基于几何失真和照明表征的文档图像校正模型;将待检测的文档图像信息输入获得的所述校正模型中,得到几何校正后的文档图像,再根据所述文档图像所受的环境光信息区分是否需要进行亮度表征学习;对于所受的环境光信息很差的文档图像,将经过几何表示学习后把图像输入到亮度表征模型中,得到亮度表征学习后的文档图像;对于照明条件良好的图像,则不需要进行亮度表征学习;将输出的文档图像结果,输出至下游任务进行文字识别或者关键信息提取处理。实现对歪曲的和环境光差的文档图像分别进行几何表示和亮度表征学习;同时引入多层注意力机制提高文档图像校正的精度。
-
-
-
-
-
-
-
-
-