-
公开(公告)号:CN118469022B
公开(公告)日:2024-10-29
申请号:CN202410919970.5
申请日:2024-07-10
Applicant: 安徽大学
IPC: G06N5/04 , G06N3/0455 , G06N3/0499 , G06F18/25 , G06V10/40 , G06V10/56 , G06V10/58 , G06F40/30 , G06V10/80 , G06V10/82 , G06N3/048
Abstract: 本发明公开了基于文本信息引导的多源遥感视觉问答方法及系统,方法包括:获得RGB特征、SAR特征以及原始文本特征;原始文本特征和RGB特征输入第一特征增强模型得到RGB增强特征,原始文本特征和SAR特征输入第二特征增强模型得到SAR增强特征;RGB增强特征、SAR增强特征以及原始文本特征均输入QGF模型得到图像融合特征;图像融合特征以及原始文本特征输入第一解码器得到融合文本特征的图像特征,将原始文本特征以及图像融合特征输入第二解码器得到融合图像特征的文本特征,经处理得到最终预测的遥感视觉问答任务答案;本发明的优点在于:提高遥感视觉问答任务回答的准确性。
-
公开(公告)号:CN119850422A
公开(公告)日:2025-04-18
申请号:CN202510030759.2
申请日:2025-01-08
Applicant: 安徽大学
IPC: G06T3/4053 , G06T3/4046 , G06V10/40 , G06V10/771 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/045
Abstract: 本发明提供一种基于Mamba的光学引导的合成孔径雷达图像超分辨率重建方法及系统,包括:浅层特征提取的步骤:采用卷积法将SAR图像和光学图像编码成统一的特征空间;多模态特征融合的步骤:将提取的浅层特征作为CFSM模块和FSAM模块的输入,动态选择相关和显著的光学特征,并根据状态空间参数在空间域和频域自适应地进行多模态特征融合,从而生成高质量的融合特征;高分辨率图像重建的步骤:将浅层特征和融合特征聚合,然后对聚合后的特征进行上采样,从而重建高分辨率图像。本发明利用视觉状态空间方程长距离建模的优势,渐进式选择光学信息中有用的信息并自适应地跨模态特征集成,有效利用空间域和频域特征,减少噪声干扰的同时恢复了更真实的纹理细节信息,实现了优越的性能。
-
公开(公告)号:CN118941914A
公开(公告)日:2024-11-12
申请号:CN202410861508.4
申请日:2024-06-28
Applicant: 安徽大学
IPC: G06V10/82 , G06V10/20 , G06V10/40 , G06V10/766 , G06V10/25 , G06V10/764 , G06N3/0464 , G06N3/084 , G06N3/09
Abstract: 本发明提供结构信息引导的SAR目标细粒度识别方法及系统,方法包括:采用了YOLOv5的策略进行数据预处理;将预处理后的数据送入DCN和注意力模块中,对图像中的关键特征进行引导增强;特征送入检测头,生成最终的识别结果;采用Focaler‑SloU进行网络训练。本发明解决了鲁棒性和泛化性较弱、虚警率高、漏检错检以及目标具体型号难以进行准确的细粒度分类的技术问题。
-
公开(公告)号:CN118469022A
公开(公告)日:2024-08-09
申请号:CN202410919970.5
申请日:2024-07-10
Applicant: 安徽大学
IPC: G06N5/04 , G06N3/0455 , G06N3/0499 , G06F18/25 , G06V10/40 , G06V10/56 , G06V10/58 , G06F40/30 , G06V10/80 , G06V10/82 , G06N3/048
Abstract: 本发明公开了基于文本信息引导的多源遥感视觉问答方法及系统,方法包括:获得RGB特征、SAR特征以及原始文本特征;原始文本特征和RGB特征输入第一特征增强模型得到RGB增强特征,原始文本特征和SAR特征输入第二特征增强模型得到SAR增强特征;RGB增强特征、SAR增强特征以及原始文本特征均输入QGF模型得到图像融合特征;图像融合特征以及原始文本特征输入第一解码器得到融合文本特征的图像特征,将原始文本特征以及图像融合特征输入第二解码器得到融合图像特征的文本特征,经处理得到最终预测的遥感视觉问答任务答案;本发明的优点在于:提高遥感视觉问答任务回答的准确性。
-
公开(公告)号:CN118429622A
公开(公告)日:2024-08-02
申请号:CN202410611543.0
申请日:2024-05-16
Applicant: 安徽大学
IPC: G06V10/25 , G06V20/40 , G06V10/40 , G06V20/70 , G06V10/52 , G06V10/80 , G06V10/82 , G06V10/26 , G06V20/17 , G06N3/0499 , G06N3/048 , G06N3/0464 , G06N3/045
Abstract: 本发明公开了基于河流信息引导的污染物高精度目标检测方法及系统,方法包括:提取含有污染问题的河流视频区段,提取视频帧;将视频帧输入SAM模型的图片编码器得到图像特征嵌入,将文本描述输入Grounding DINO模型,Grounding DINO模型的输出结果输入到SAM模型的提示编码器得到提示特征嵌入;将图像特征嵌入以及提示特征嵌入均输入区域解耦模块得到先验增强特征;将视频帧输入检测器骨干网络获得多尺度特征;将先验增强特征与多尺度特征分别采用FFM模块进行融合得到多尺度融合特征;将多尺度融合特征均输入检测头,对污染物进行识别;本发明的优点在于:减少人力物力,且检测精度高。
-
-
-
-