-
公开(公告)号:CN116958668A
公开(公告)日:2023-10-27
申请号:CN202310856207.8
申请日:2023-07-12
Applicant: 中国科学院自动化研究所
IPC: G06V10/764 , G06V10/40 , G06V10/74 , G06F16/35 , G06V10/82 , G06N3/0455 , G06N3/08
Abstract: 本发明涉及计算机视觉领域,提供一种领域泛化方法、装置、电子设备和存储介质,其中方法包括:获取源域样本图像和目标域图像;基于文本提示模板,生成包括领域信息和图像类别信息的领域相关文本;基于图像编码器,提取源域样本图像的视觉特征,并基于文本编码器,提取领域相关文本的文本特征;基于分类器,应用视觉特征对源域样本图像进行图像分类,并应用文本特征对领域相关文本进行文本分类;基于图像分类损失和文本分类损失,对图像编码器和分类器进行参数迭代,参数迭代完成后的图像编码器和分类器用于对目标域图像进行分类。本发明提供的领域泛化方法、装置、电子设备和存储介质,有效地提升了模型的泛化性。