基于跨域截断式迁移学习的放大内镜图像病变分类方法

    公开(公告)号:CN119229220B

    公开(公告)日:2025-02-18

    申请号:CN202411746649.8

    申请日:2024-12-02

    Abstract: 本发明提供了基于跨域截断式迁移学习的放大内镜图像病变分类方法,包括获取放大内镜的真实图像、病变类别,构建训练、验证和测试数据集;构建基于跨域截断式迁移学习的放大内镜图像病变分类模型,设置截断点后进行训练,得到训练后的放大内镜图像病变分类模型;利用验证数据集对模型进行评估,根据验证结果调整模型参数,确定最终的模型;利用测试数据集进行测试,将经过测试的放大内镜图像病变分类模型应用于实际的放大内镜图像病变分类任务中。该方法适用于关于放大内镜图片病变类别工作,在模型训练过程中利用分层截断策略以及动态学习率调整机制,提升了模型的分类精度和训练效率,具有较强的实用性和推广价值。

    一种基于注意力导向细节修复的文档图像阴影去除方法

    公开(公告)号:CN118898847B

    公开(公告)日:2025-01-17

    申请号:CN202411390566.X

    申请日:2024-10-08

    Abstract: 本发明提出一种基于注意力导向细节修复的文档图像阴影去除方法,包括以下步骤;步骤S1、利用YCbCr颜色空间变换和亮度信息生成阴影注意力图作为标签,以识别阴影区域;步骤S2、通过阴影注意力生成子网络,采用多尺度大核注意力机制,提取阴影特征,获得最优注意力图;步骤S3、对所述最优注意力图和阴影特征进行动态融合;步骤S4、通过细节细化子网络,采用轻量级空间通道卷积计算并恢复图像细节;步骤S5、基于损失函数,通过端到端训练优化网络参数;步骤S6、使用训练完成的网络对文档图像进行阴影去除处理。旨在有效去除文档图像中的复杂阴影,同时保留图像细节,并以较低的计算复杂度实现。

    基于多模态大模型的甲骨文字图像识别方法、装置、设备和介质

    公开(公告)号:CN119251852A

    公开(公告)日:2025-01-03

    申请号:CN202411774132.X

    申请日:2024-12-05

    Abstract: 一种基于多模态大模型的甲骨文字图像识别方法、装置、设备和介质,涉及计算机视觉技术领域。其中,这种甲骨文字图像识别方法首先,从OBIMD数据集提取甲骨文单字图像,并从镜原甲骨平台检索基础信息,形成单字数据集。接着,利用大语言模型生成包含文字释义等信息的第一对话数据集,并对Qwen2VL模型进行微调,得到初始识别模型。然后,通过位置信息对话数据集进行第二微调,获得定位顺序识别模型,该模型能识别字符并完成定位标注。进一步,生成现代汉语翻译对话数据集,并对模型进行第三微调,得到语义识别模型,能组合字符成句并翻译。最后,输入待识别甲骨图像,模型根据图像是单字或多字,分别输出字符标识、释义或组合句子并翻译成现代汉语。

    一种基于病理信息引导的扩散模型放大内镜图像生成方法

    公开(公告)号:CN119228940A

    公开(公告)日:2024-12-31

    申请号:CN202411774131.5

    申请日:2024-12-05

    Abstract: 本发明提供了一种基于病理信息引导的扩散模型放大内镜图像生成方法,包括获取放大内镜的真实图像、Mask图像和病理信息文本提示,构建训练、测试数据集;构建基于病理信息引导的放大内镜图像生成模型通过训练数据集进行训练,得到训练好的放大内镜图像生成模型;利用测试数据集进行测试,评估其在未知数据上的性能,评估合格的即为最终得到的放大内镜图像生成模型;将最终得到的放大内镜图像生成模型应用于放大内镜图像生成工作,获取模型生成的放大内镜图像。该方法适用于关于放大内镜图片生成工作,利用病理信息和背景Mask图片引导的方式来精准生成不同病理的放大内镜图片,有效的解决了关于放大内镜图片下游分割和分类任务的数据不平衡问题。

    一种基于不确定性与图神经网络的多视图聚类方法

    公开(公告)号:CN119206279A

    公开(公告)日:2024-12-27

    申请号:CN202411729686.8

    申请日:2024-11-29

    Abstract: 本发明提供的一种基于不确定性与图神经网络的多视图聚类方法,涉及多视图聚类技术领域。本发明通过获取多视图数据集,进行预处理后,得到原始特征矩阵与邻接矩阵;对输入的所述原始特征矩阵和所述邻接矩阵进行特征提取与融合后,得到一致嵌入矩阵与转移矩阵;基于Dempster‑Shafer证据理论与狄利克雷分布,通过降低所述一致嵌入矩阵中嵌入空间的不确定性,得到可靠一致嵌入;将所述可靠一致嵌入与所述转移矩阵映射为最终嵌入;对所述最终嵌入进行解码重建与聚类分析,得到聚类结果。本发明能充分挖掘视图中的潜在信息,降低模型中的不确定性,解决了多视图聚类任务中存在的噪声问题,能够快速、高效、准确地得到多视图数据的聚类结果。

    一种基于稀疏与远邻节点增强的图表示学习方法

    公开(公告)号:CN119204096A

    公开(公告)日:2024-12-27

    申请号:CN202411707990.2

    申请日:2024-11-27

    Abstract: 本发明提供的一种基于稀疏与远邻节点增强的图表示学习方法,涉及数据增强技术领域。本发明根据获取的待增强的图结构数据集,得到初始节点特征矩阵、邻接矩阵与原始分类标签,并划分训练集与测试集;利用特征增强技术对训练集的节点特征进行强化,得到稀疏增强图结构数据集;然后结合节点混合技术,通过对类内节点和类间节点进行特征和分类标签的混合,以增加远邻节点的可达性,得到远邻增强图结构数据集;将远邻增强图结构数据集输入图神经网络模型进行图表示学习与训练,从而得到最优的节点表示与训练好的图表示学习模型;最后经模型测试评估,得到评估好的模型。本发明解决了传统图神经网络在处理稀疏节点和远邻节点信息聚合时的不足。

    基于音高调制的音频稀疏对抗攻击方法、装置、设备及介质

    公开(公告)号:CN118471253A

    公开(公告)日:2024-08-09

    申请号:CN202410917115.0

    申请日:2024-07-10

    Abstract: 本发明提供了基于音高调制的音频稀疏对抗攻击方法、装置、设备及介质,包括:进行音调移位,将输入音频进行音调移位,以改变音频的频率并引发ASR系统的初步误识别;使用语音活动检测识别音频中的活跃语音片段,生成二进制掩码以标识这些片段;进行稀疏噪声生成;将优化后的扰动向量与掩码向量相结合,生成最终的对抗性音频样本,使其能够有效攻击ASR系统并且难以被人耳察觉。本发明实现了在保持对抗性音频可听性的同时,简化攻击过程并提高了对抗性噪声的隐蔽性和有效性。

    一种基于多样特征生成的零样本汉字识别方法

    公开(公告)号:CN118378621A

    公开(公告)日:2024-07-23

    申请号:CN202410808562.2

    申请日:2024-06-21

    Abstract: 本发明提出一种基于多样特征生成的零样本汉字识别方法,解析汉字的部首组成获取表意描述序列;对表意描述序列进行混合语义嵌入获得多语义向量;对已见类汉字图像进行特征提取获取真实特征;构建特征生成网络学习多语义向量到真实特征的映射;通过已见类训练集进行训练后通过多种未见类语义向量生成未见类特征;利用未见类特征结合已见类训练集的特征共同训练识别模型使其具备识别已见类和未见类汉字能力。本发明通过混合语义嵌入提供多种语义来生成训练样本,有助于缓解合成特征的域迁移问题和特征混淆问题,提高特征生成的泛化能力和鲁棒性;通过为识别模型提供高质量的未见类特征,缓解零样本汉字识别的偏倚问题,提高了未见汉字的识别能力。

Patent Agency Ranking