-
公开(公告)号:CN119810540A
公开(公告)日:2025-04-11
申请号:CN202411890313.9
申请日:2024-12-20
Applicant: 哈尔滨理工大学
IPC: G06V10/764 , G06V20/10 , G06V10/58 , G06V10/52 , G06V10/80 , G06V10/77 , G06V10/82 , G06N3/0464
Abstract: 本发明提出了一种基于多尺度卷积和特征融合的高光谱图像开放集分类方法,旨在提升高光谱图像中已知类别和未知类别的分类精度和分类模型的鲁棒性。该方法通过深度学习模型融合光谱和空间特征,解决了高光谱图像分类中的未知类别识别和特征优化问题。首先通过多尺度卷积提取光谱特征,并结合通道注意力机制,增强了对最具判别性光谱信息的捕捉。其次,通过多分支结构和卷积增强技术优化了光谱特征的表达,提升对复杂空间信息的感知能力。空间特征则通过高频增强技术得到强化,提升了对细节和边缘信息的敏感性。本发明通过创新的特征提取和融合策略,提升了高光谱图像开放集的分类精度与分类模型的鲁棒性。
-
公开(公告)号:CN119295804A
公开(公告)日:2025-01-10
申请号:CN202411310186.0
申请日:2024-09-19
Applicant: 哈尔滨理工大学
IPC: G06V10/764 , G06V10/82 , G06V10/774 , G06V20/10
Abstract: 本发明一种结合噪声启发和注意力机制改进的NAS高光谱图像农作物分类方法涉及遥感图像分类领域;该方法依次执行以下步骤:步骤a、获取高光谱图像数据集,并人为地向图像数据中注入随机噪声;步骤b、构建一个用于高光谱图像农作物分类的神经网络架构搜索模型,集成通道注意力机制和位置尺度感知机制,以提高计算效率和模型的适应能力,并使用焦点损失函数增强对困难样本的处理和抗噪性能;步骤c、搜索架构并进行架构评估;步骤d、利用最终输出的架构进行模型训练;步骤e、使用完整的测试集进行测试,并输出分类结果。本发明通过引入基于通道的注意力机制、位置和尺度感知机制,以及焦点损失函数,显著增强了对混有噪音的高光谱农作物图像的处理能力,从而在分类精度和模型的鲁棒性方面取得了显著提升。
-
公开(公告)号:CN119048878A
公开(公告)日:2024-11-29
申请号:CN202411061740.6
申请日:2024-11-02
Applicant: 哈尔滨理工大学
IPC: G06V10/82 , G06V10/80 , G06V10/764 , G06N3/0464 , G06N3/0985 , G06N3/0455
Abstract: 本发明属于目标检测技术领域,具体涉及一种改进YOLOv8的X射线安检图像危险品检测系统;该方法依次执行以下步骤:获取X射线危险品图像数据集并进行数据增强;搭建改进的YOLO‑GEMA网络模型,包括:在YOLOv8的Backbone和Neck中添加GELAN(Generalized Efficient Layer Aggregation Network);在YOLOv8的Neck中加入EMA(Efficient Multi‑ScaleAttention)注意力机制;最后采用inner‑CIoU改进损失函数加快收敛速度。利用训练集对改进的YOLOv8模型进行训练得到X射线安检图像检测模型;利用测试集对训练好的模型进行测试得到危险品检测结果。本发明通过使用改进的YOLOv8算法进行X射线安检图像的检测,能够更加精确的检测出危险品,提高安检效率。
-
公开(公告)号:CN119180984A
公开(公告)日:2024-12-24
申请号:CN202411206314.7
申请日:2024-08-29
Applicant: 哈尔滨理工大学
IPC: G06V10/764 , G06V10/774 , G06V10/82 , G06V20/10 , G06N3/0464
Abstract: 本发明提出了一种3DCNN结合MLP的标签含噪高光谱图像农作物分类方法,属于图像分类技术领域。首先,本发明通过3D卷积神经网络(3D Convolutional Neural Network,3DCNN)同时提取空间和光谱特征,充分利用高光谱图像的三维信息。然后,引入多层感知器(Multilayer Perceptron,MLP)进行分类决策,以充分发挥其在处理高维特征空间中的优势。为了进一步增强模型对噪声标签的鲁棒性,本发明在训练样本的同时引入了归一化交叉熵(Normalized Cross Entropy,NCE)和逆交叉熵(Reverse Cross Entropy,RCE)混合的损失函数,减少噪声样本对模型的干扰。综合利用3DCNN的强大特征提取能力和MLP的优秀分类性能,再结合混合损失函数,最后获取农作物类别。本发明通过充分利用3DCNN和MLP在高光谱图像分类中的特征提取与分类决策优势,结合RCE和NCE的混合损失函数,构建了对噪声标签具有鲁棒性且更加精准的分类模型。该创新性方法不仅显著提升了对高光谱图像中噪声标签的处理能力,还增强了模型对高维特征空间的理解与表征。在噪声标签的高光谱图像分类任务中,本发明展示出卓越的分类性能,对于提升高光谱图像农作物分类的准确性和鲁棒性具有重要的科学与实用价值。
-
公开(公告)号:CN118887270A
公开(公告)日:2024-11-01
申请号:CN202410904753.9
申请日:2024-07-07
Applicant: 哈尔滨理工大学
IPC: G06T7/593 , G06N3/0464 , G06N3/096
Abstract: 深度估计在医学影像中具有重要应用价值,可以弥补医生在手术过程中由于观察目镜感官受限而难以获得精确深度信息的不足。针对内腔手术场景动态多变、软组织尺度微小等原因导致深度估计精度不高的问题,本发明提出了一种结合迁移学习和注意力机制的内腔图像深度估计方法。通过利用U‑net网络对内腔图像进行多尺度的特征提取,并结合通道和空间注意力来优化解码的精度,利用多层级深度优化对图像深度进行估计。同时,针对内腔环境中数据集较少、缺少可靠真值的问题,利用室内数据集对MVSNet网络进行预训练,再将学到的特征和权重利用迁移学习对目标内腔数据集的训练网络进行微调。并针对内腔表面图像引入邻域平滑损失项约束具有相似外观的相邻像素,达到生成平滑深度表面的效果。实验表明,本发明的深度估计网络在Hamlyn公开内腔数据集上显著提高了内腔图像的深度估计精度和完整性。
-
公开(公告)号:CN118885385A
公开(公告)日:2024-11-01
申请号:CN202410904782.5
申请日:2024-07-07
Applicant: 哈尔滨理工大学
IPC: G06F11/36 , G06F21/62 , G06N3/0464 , G06N3/09 , G06N3/098
Abstract: 本发明涉及联邦学习、软件缺陷预测技术领域,公开了一种基于继承联邦学习的异构软件缺陷预测方法,解决了软件缺陷预测中单一数据集的数据不充分以及多源数据带来的数据异构和隐私性问题。该方法包括:对各本地数据集采用综合过采样Synthetic Minority Over‑sampling Technique combined with Tomek Links(SMOTETomek)算法和核主成分分析(Kernel Principal Component Analysis,KPCA)算法进行预处理;在本地训练阶段加入继承私有模型(Inherited Private Models,IPM),将历史训练中的模型知识进行迁移,共同参与本轮训练;在全局聚合阶段引入差异感知协作(Discrepancy‑aware Collaboration,DC)算法,考虑数据分布的情况下重新分配聚合权重。在迭代优化上采用了Ranger算法,由于参数更新上加入了多种不可逆的混合运算,因此能够加速收敛的同时有效保护数据隐私安全。
-
-
-
-
-