-
公开(公告)号:CN119831877A
公开(公告)日:2025-04-15
申请号:CN202411956222.0
申请日:2024-12-28
Applicant: 河南大学 , 北京空间飞行器总体设计部
IPC: G06T5/60 , G06T5/50 , G06V10/34 , G06V10/774 , G06V10/82
Abstract: 本发明涉及人工智能图像处理技术领域,具体涉及融合背景引导约束的模糊图像扩散复原方法,该方法包括:将背景引导约束融入复原损失中,再结合预训练的扩散生成模块,实现了对模糊图像的复原。为提升复原的准确、真实性,利用生成图像与噪声图像背景之间的相似性对复原过程加以引导形成背景引导约束,改善了复原过程中背景过平滑导致的复原图像不真实的问题。为保持图像中更多的细节和轮廓信息,在复原之后图像的基础上再利用预训练好的扩散生成模块,生成更多图像的细节。最终,提出一个融合背景引导约束的模糊图像复原网络,能够有效缓解噪声、拍摄等因素导致的图像退化,改善图像质量。通过对图像进行复原能够将图像的主体变得更加清晰。
-
公开(公告)号:CN119478494A
公开(公告)日:2025-02-18
申请号:CN202411420466.7
申请日:2024-10-12
Applicant: 河南大学
IPC: G06V10/764 , G06V10/44 , G06V10/774 , G06N3/0464 , G06N3/048 , G06V10/82 , G06V10/46
Abstract: 本发明公开了一种基于CSC和提示学习的零样本图像描述生成方法,该方法基于卷积稀疏编码思想,构造两层图像稀疏特征提取模型,通过提取稀疏特征减少干扰特征然后导入图像编码器进一步提取特征,再将得到的图像的特征经过文本解码器得到图像的类别硬提示,最后将图像的类别硬提示和图像特征输入大语言模型进行图像描述生成。该方法通过图像稀疏特征提取和加入类别硬提示使大语言模型在生成图像描述时可以充分利用到原图像中的关键信息,减少图像中背景特征的干扰,减轻大模型幻觉问题,可以在开放世界环境中得到更好的图像描述生成效果。
-