-
公开(公告)号:CN119624982A
公开(公告)日:2025-03-14
申请号:CN202411847031.0
申请日:2024-12-16
Applicant: 重庆大学
IPC: G06T7/10 , G06N3/045 , G06N3/0442 , G06V10/40 , G06N3/0464 , G06N3/084
Abstract: 本发明公开了一种基于不确定性估计的多模态状态空间集成的图像分割方法,该方法包括:获取图像数据和图像数据对应的文本数据;利用CLV‑SSIF模型,根据图像数据和文本数据,对图像进行分割,其中,CLV‑SSIF模型包含多模态空间集成组件和多专家不确定性优化组件,多模态空间集成组件包括图像编码器、文本编码器以及多模态交互式引导解码器;多专家不确定性优化组件用于利用多专家混合模型,生成对图像的初始分割结果并生成专家不确定估计,然后根据专家不确定估计,对初始分割结果进行优化。本发明的方法提升了图像分割的准确度。
-
公开(公告)号:CN119723185A
公开(公告)日:2025-03-28
申请号:CN202411788583.9
申请日:2024-12-06
Applicant: 重庆大学
IPC: G06V10/764 , G06V10/25 , G06V10/42 , G06V10/82 , G06V10/80 , G06V10/77 , G06N3/0455 , G06N3/047 , G06N3/08
Abstract: 本发明涉及计算机视觉技术领域,具体公开了一种基于块间阶梯式Transformer的目标重识别方法及系统,该系统提出了一种新颖的特征提取网络,称为基于多子空间特征调整的块间阶梯式Transformer(IBLSFormer),用于目标重识别。IBLSFormer的核心是多子空间特征调整(MSFA)模块。其可以在欧氏距离子空间、余弦距离子空间和KL散度子空间等多个子空间中通过类‑补丁交互动态调整特征,增强显著补丁标记并削弱非显著补丁标记。此外,在内部编码器块MSFA中嵌入从窄到宽的阶梯式约束以优化特征学习。大量实验表明,IBLSFormer在学习判别性和鲁棒性表示以进行目标重识别方面优于其他方法。
-
公开(公告)号:CN119538188A
公开(公告)日:2025-02-28
申请号:CN202411596655.X
申请日:2024-11-11
Applicant: 重庆大学
IPC: G06F18/25 , G06F18/24 , G06N3/0455 , G06N3/045 , G06N3/0464 , G06N3/084 , G06N3/09
Abstract: 本发明公开了一种基于交换的多模态多尺度变换融合方法和系统,该方法包括:获取原始图像数据和原始文本数据并输入MMTF模型,生成融合结果,其中,MMTF模型包括:多模态编码器模块、解码器模块、基于通道的信息交换模块和多尺度融合模块,多模态编码器模块包括文本编码器和双分支图像解码器;解码器模块对编码器生成的嵌入进行解码;基于通道的信息交换模块对不同通道上的不同模态的嵌入进行信息交换;多尺度融合模块,用于根据不同分支上的图像特征和文本特征,融合来自一个分支的cls令牌和来自另一个分支中的补丁令牌。本发明的方法可以在各种医疗环境中提供可靠的决策支持,提高诊断准确性并减少临床医生的工作量。
-
公开(公告)号:CN119694479A
公开(公告)日:2025-03-25
申请号:CN202411857618.X
申请日:2024-12-17
Applicant: 重庆大学
IPC: G16H15/00 , G06T5/50 , G06F40/289 , G06F40/284 , G06N3/098 , G06N3/0455 , G06N3/0499
Abstract: 本发明涉及人工智能技术领域,具体公开了一种多视图医学图像与文本报告之间的互学习方法及系统,通过构建互学习模型并将互学习模型的学习过程划分为图像重建任务、报告重建任务和多视图对齐任务,图像重建任务获取多视图医学图像的特征表示,报告重建任务获取文本报告的特征表示并将其与图像特征表示进行跨模态融合得到重建文本报告,多模态重建任务的集成使模型能够学习更丰富、更详细的特征表示,提高了其对丢失或损坏数据的鲁棒性。此外,跨模态文本重建中基于交换的多模态融合方法旨在充分整合视觉特征,丰富领域特定知识的语义表示。通过预训练和联合训练,优化模型性能,以便在应用该互学习模型后获得更准确和全面的诊断结果。
-
-
-