一种基于病理信息引导的扩散模型放大内镜图像生成方法

    公开(公告)号:CN119228940A

    公开(公告)日:2024-12-31

    申请号:CN202411774131.5

    申请日:2024-12-05

    Abstract: 本发明提供了一种基于病理信息引导的扩散模型放大内镜图像生成方法,包括获取放大内镜的真实图像、Mask图像和病理信息文本提示,构建训练、测试数据集;构建基于病理信息引导的放大内镜图像生成模型通过训练数据集进行训练,得到训练好的放大内镜图像生成模型;利用测试数据集进行测试,评估其在未知数据上的性能,评估合格的即为最终得到的放大内镜图像生成模型;将最终得到的放大内镜图像生成模型应用于放大内镜图像生成工作,获取模型生成的放大内镜图像。该方法适用于关于放大内镜图片生成工作,利用病理信息和背景Mask图片引导的方式来精准生成不同病理的放大内镜图片,有效的解决了关于放大内镜图片下游分割和分类任务的数据不平衡问题。

    一种基于不确定性与图神经网络的多视图聚类方法

    公开(公告)号:CN119206279A

    公开(公告)日:2024-12-27

    申请号:CN202411729686.8

    申请日:2024-11-29

    Abstract: 本发明提供的一种基于不确定性与图神经网络的多视图聚类方法,涉及多视图聚类技术领域。本发明通过获取多视图数据集,进行预处理后,得到原始特征矩阵与邻接矩阵;对输入的所述原始特征矩阵和所述邻接矩阵进行特征提取与融合后,得到一致嵌入矩阵与转移矩阵;基于Dempster‑Shafer证据理论与狄利克雷分布,通过降低所述一致嵌入矩阵中嵌入空间的不确定性,得到可靠一致嵌入;将所述可靠一致嵌入与所述转移矩阵映射为最终嵌入;对所述最终嵌入进行解码重建与聚类分析,得到聚类结果。本发明能充分挖掘视图中的潜在信息,降低模型中的不确定性,解决了多视图聚类任务中存在的噪声问题,能够快速、高效、准确地得到多视图数据的聚类结果。

    一种基于稀疏与远邻节点增强的图表示学习方法

    公开(公告)号:CN119204096A

    公开(公告)日:2024-12-27

    申请号:CN202411707990.2

    申请日:2024-11-27

    Abstract: 本发明提供的一种基于稀疏与远邻节点增强的图表示学习方法,涉及数据增强技术领域。本发明根据获取的待增强的图结构数据集,得到初始节点特征矩阵、邻接矩阵与原始分类标签,并划分训练集与测试集;利用特征增强技术对训练集的节点特征进行强化,得到稀疏增强图结构数据集;然后结合节点混合技术,通过对类内节点和类间节点进行特征和分类标签的混合,以增加远邻节点的可达性,得到远邻增强图结构数据集;将远邻增强图结构数据集输入图神经网络模型进行图表示学习与训练,从而得到最优的节点表示与训练好的图表示学习模型;最后经模型测试评估,得到评估好的模型。本发明解决了传统图神经网络在处理稀疏节点和远邻节点信息聚合时的不足。

    基于音高调制的音频稀疏对抗攻击方法、装置、设备及介质

    公开(公告)号:CN118471253A

    公开(公告)日:2024-08-09

    申请号:CN202410917115.0

    申请日:2024-07-10

    Abstract: 本发明提供了基于音高调制的音频稀疏对抗攻击方法、装置、设备及介质,包括:进行音调移位,将输入音频进行音调移位,以改变音频的频率并引发ASR系统的初步误识别;使用语音活动检测识别音频中的活跃语音片段,生成二进制掩码以标识这些片段;进行稀疏噪声生成;将优化后的扰动向量与掩码向量相结合,生成最终的对抗性音频样本,使其能够有效攻击ASR系统并且难以被人耳察觉。本发明实现了在保持对抗性音频可听性的同时,简化攻击过程并提高了对抗性噪声的隐蔽性和有效性。

    一种基于多样特征生成的零样本汉字识别方法

    公开(公告)号:CN118378621A

    公开(公告)日:2024-07-23

    申请号:CN202410808562.2

    申请日:2024-06-21

    Abstract: 本发明提出一种基于多样特征生成的零样本汉字识别方法,解析汉字的部首组成获取表意描述序列;对表意描述序列进行混合语义嵌入获得多语义向量;对已见类汉字图像进行特征提取获取真实特征;构建特征生成网络学习多语义向量到真实特征的映射;通过已见类训练集进行训练后通过多种未见类语义向量生成未见类特征;利用未见类特征结合已见类训练集的特征共同训练识别模型使其具备识别已见类和未见类汉字能力。本发明通过混合语义嵌入提供多种语义来生成训练样本,有助于缓解合成特征的域迁移问题和特征混淆问题,提高特征生成的泛化能力和鲁棒性;通过为识别模型提供高质量的未见类特征,缓解零样本汉字识别的偏倚问题,提高了未见汉字的识别能力。

    一种基于上下文驱动的边缘增强医学图像分割方法

    公开(公告)号:CN117853456A

    公开(公告)日:2024-04-09

    申请号:CN202410037862.5

    申请日:2024-01-10

    Abstract: 本发明涉及一种基于上下文驱动的边缘增强医学图像分割方法。包括:步骤S1、图像经过数据增强预处理,划分数据集;步骤S2、图像经过GHPA编码器,编码为图像特征向量;步骤S3、将编码器浅层特征与深层高级语义信息互相融合得到包含丰富语义的边缘信息;步骤S4、进一步增强所得到特征图的边缘特征,设计一种简单有效的金字塔特征提取方案,用于挖掘每个阶段的边缘多粒度信息;步骤S5、将编码器相邻两层特征图进行拼接;步骤S6、最后将编码器的四个输出特征图D1,D2,D3,D4相加得到最终分割图。本发明方法适用于各种医学图像的分割任务,有效的加强了医学图像现存的边缘对比度低,边缘模糊等问题,提高了模型的特征提取能力。

    基于高阶结构建模的跨模态行人重识别方法及系统

    公开(公告)号:CN117218603A

    公开(公告)日:2023-12-12

    申请号:CN202311366734.7

    申请日:2023-10-20

    Abstract: 本发明涉及一种基于高阶结构建模的跨模态行人重识别方法及系统,该方法包括:1)从数据集中成对抽取多个行人的VIS图片和IR图片,形成VIS‑IR图片对训练数据集;2)构建跨模态行人重识别网络模型,跨模态行人重识别网络模型主要包括用于提取图像基本特征的骨干网络、用于提取不同范围尺度特征的短长范围特征提取模块、用于学习图像中高阶结构信息的高阶结构学习模块和用于减少行人在不同模态下差异的共享空间学习模块;通过训练数据集对模型进行训练,得到可泛化的模型参数;3)将训练好的跨模态行人重识别网络模型用于跨模态检索,实现不同模态之间的行人重识别。该方法及系统有利于获得更加稳定、鲁棒、准确的跨模态行人重识别结果。

Patent Agency Ranking