基于多模态域相关提示的无监督域适应方法及装置

    公开(公告)号:CN119647549A

    公开(公告)日:2025-03-18

    申请号:CN202510170889.6

    申请日:2025-02-17

    Abstract: 本发明公开了基于多模态域相关提示的无监督域适应方法及装置,涉及无监督域适应技术领域,包括以下步骤:接收预先建立的域相关文本提示,将域相关文本提示输入至预先建立的线性映射网络模型内,输出得到域相关的视觉提示,其中,所述域相关的视觉提示被引入层特定的视觉提示;组合图像和域相关的视觉提示输入至视觉编码器得到视觉特征,接收多层级域特征,将视觉特征和多层级域特征输入至基于注意力的特征增强网络模型内,输出得到域增强后的视觉特征;将域增强后的视觉特征与经过文本编码器编码后的域相关文本提示进行对齐训练,从而实现域相关的多模态联合对齐。

Patent Agency Ranking