一种基于交换的多模态多尺度变换融合方法和系统

    公开(公告)号:CN119538188A

    公开(公告)日:2025-02-28

    申请号:CN202411596655.X

    申请日:2024-11-11

    Applicant: 重庆大学

    Abstract: 本发明公开了一种基于交换的多模态多尺度变换融合方法和系统,该方法包括:获取原始图像数据和原始文本数据并输入MMTF模型,生成融合结果,其中,MMTF模型包括:多模态编码器模块、解码器模块、基于通道的信息交换模块和多尺度融合模块,多模态编码器模块包括文本编码器和双分支图像解码器;解码器模块对编码器生成的嵌入进行解码;基于通道的信息交换模块对不同通道上的不同模态的嵌入进行信息交换;多尺度融合模块,用于根据不同分支上的图像特征和文本特征,融合来自一个分支的cls令牌和来自另一个分支中的补丁令牌。本发明的方法可以在各种医疗环境中提供可靠的决策支持,提高诊断准确性并减少临床医生的工作量。

    多视图医学图像与文本报告之间的互学习方法及系统

    公开(公告)号:CN119694479A

    公开(公告)日:2025-03-25

    申请号:CN202411857618.X

    申请日:2024-12-17

    Applicant: 重庆大学

    Abstract: 本发明涉及人工智能技术领域,具体公开了一种多视图医学图像与文本报告之间的互学习方法及系统,通过构建互学习模型并将互学习模型的学习过程划分为图像重建任务、报告重建任务和多视图对齐任务,图像重建任务获取多视图医学图像的特征表示,报告重建任务获取文本报告的特征表示并将其与图像特征表示进行跨模态融合得到重建文本报告,多模态重建任务的集成使模型能够学习更丰富、更详细的特征表示,提高了其对丢失或损坏数据的鲁棒性。此外,跨模态文本重建中基于交换的多模态融合方法旨在充分整合视觉特征,丰富领域特定知识的语义表示。通过预训练和联合训练,优化模型性能,以便在应用该互学习模型后获得更准确和全面的诊断结果。

Patent Agency Ranking