-
公开(公告)号:CN119206181A
公开(公告)日:2024-12-27
申请号:CN202411323704.2
申请日:2024-09-23
Applicant: 重庆邮电大学
IPC: G06V10/25 , G06V10/764 , G06V10/82 , G06V10/44 , G06V20/13 , G06N3/0464 , G06N3/048 , G06N3/084
Abstract: 本发明涉及一种基于YOLOv5的遥感小目标检测方法,属于目标检测领域,包括:S1:采集并预处理数据集,划分为训练集、验证集和测试集;S2:将数据集中的标签文件转换为YOLOv5格式;S3:创建数据集的配置文件;S4:构建RStargetNet网络:以YOLOv5网络为基础,使用VanillaNet作为骨干网络,加入SENet通道注意力机制,置信度损失和类别损失采用BCEloss,定位损失采用CIoUloss;S5:对RStargetNet网络进行训练、验证和测试,得到最优模型;S6:利用最优模型对输入网络中的图片进行预测,获得各个检测目标的类别名称、置信度分数和目标框坐标信息,并展示在图片中。
-
公开(公告)号:CN119888221A
公开(公告)日:2025-04-25
申请号:CN202411912501.7
申请日:2024-12-24
Applicant: 重庆邮电大学
IPC: G06V10/26 , G06V10/44 , G06V10/80 , G06V10/82 , G06N3/045 , G06N3/0455 , G06N3/0464
Abstract: 本发明涉及一种面向高分辨率遥感图像的多尺度双分支语义分割方法,属于计算机技术领域。该方法包括:采集数据集并预处理;构建浅层特征提取融合模块,该模块通过双分支结构的ResNet分别处理VIS和DSM数据,利用卷积层提取特征后经特征融合模块融合,能充分挖掘不同数据源特征并融合;构建深层特征提取融合模块,该模块的SCSA层结合通道与空间注意力处理特征图,跨模态自注意力层计算跨模态注意力并融合结果;接着构建级联解码器,再用训练集训练网络,最后用测试集测试网络。该方法解决了高分辨率遥感图像语义分割中地物特征复杂多样、空间分布不均及VIS和DSM数据信息融合不充分等问题。
-
公开(公告)号:CN119360635A
公开(公告)日:2025-01-24
申请号:CN202411370624.2
申请日:2024-09-29
Applicant: 重庆邮电大学
IPC: G08G1/065 , G08G1/01 , G06N3/0442
Abstract: 本发明涉及一种基于长短期时空图神经网络的交通流预测方法,属于计算机技术领域。该方法为:输入长时间序列的交通流数据,将长时间序列划分成等长的非重叠的子序列,为了提高模型的运行效率,对子序列进行掩码重构;接着将处理后的子序列分别送入长期特征提取器、短期特征提取器与周期特征提取器,再将提取到的特征进行拼接,最终通过多层感知机进一步处理这些拼接的特征,得到最后的预测结果。该方法让子序列成为特征提取的基本单位,并引入掩码机制,使得模型使模型可以从长时间序列中学习压缩的、上下文信息丰富的子序列表示。通过堆叠多层扩张因果卷积进行特征提取,捕捉长时间序列中的趋势特征,避免传统预测算法中面临的梯度消失问题。
-
公开(公告)号:CN117571014A
公开(公告)日:2024-02-20
申请号:CN202311520271.5
申请日:2023-11-15
Applicant: 重庆邮电大学
Abstract: 本发明涉及一种结合图像描述和文本生成图像的视觉语言导航方法,属于视觉语言导航技术领域。该方法为:获取视觉语言导航任务的自然语言目标指令和当前所处位置的视觉图像;通过场景描述模块生成基于当前场景的详尽自然语言描述;通过文本生成图像模型生成与所描述场景有着类似核心物品对象以及核心场景布局的相似场景;将当前场景和对应相似场景通过多层Transformer结构和细尺度跨模态编码器进行编码;将当前场景编码和相似场景编码动态融合生成综合考虑了当前真实场景和对应相似场景的融合动作预测。该方法通过为任务训练提供额外的视觉数据输入,解决了视觉语言导航任务的数据稀缺问题,提高了智能体的任务性能和模型的泛化能力。
-
-
-