-
公开(公告)号:CN117853816A
公开(公告)日:2024-04-09
申请号:CN202410096914.6
申请日:2024-01-24
Applicant: 哈尔滨理工大学
IPC: G06V10/764 , G06N3/0464 , G06N3/0499 , G06N3/0455 , G06N3/048 , G06N3/08
Abstract: 本发明公开了基于多尺度SE注意力机制结合ViT的高光谱图像分类系统及方法,涉及图像分类技术领域。本发明的多尺度SEResBlock单元,包括若干个级联的SEResBlock模块,通过依次级联的SEResBlock模块得到高光谱的中层次特征;ViT单元包括级联的嵌入模块、Transformer编码器和MLP模块,所述Transformer编码器包括Cross‑Re‑Attention子模块和前馈网络子模块,所述Cross‑Re‑Attention子模块用以提取高光谱图像的高层次特征,所述MLP模块输出分类结果。本发明能够从不同尺度提取光谱特征,提高图像的分类精度。
-
公开(公告)号:CN117351553A
公开(公告)日:2024-01-05
申请号:CN202310848917.6
申请日:2023-07-12
Applicant: 哈尔滨理工大学
Abstract: 一种基于FPSA‑L2CSNet的视线估计系统及方法,涉及计算机视线估计领域。本发明的面部特征提取单元包括以获取低层次特征的5个Single BlazeBlock和用以获取高层次特征的6个Double BlazeBlock,根据低层次特征图和高层次特征图获取人脸的五官信息,定位左眼区域和右眼区域;ResNet网络包括依次布置的第一残差模块组、第二残差模块组、第三残差模块组和第四残差模块组,第一残差模块组、第二残差模块组、第三残差模块组和第四残差模块组分别由若干残差模块构成,残差模块包括两个1×1卷积层和PSA模块。通过面部特征提取单元缩小人眼特征区域的提取范围,采用改进ResNet网络实现更细粒度水平的特征提取,达到精准的视线估计效果。
-
公开(公告)号:CN117274775A
公开(公告)日:2023-12-22
申请号:CN202311221688.1
申请日:2023-09-20
Applicant: 哈尔滨理工大学
IPC: G06V10/82 , G06V10/774 , G06V10/776 , G06T7/00
Abstract: 本发明公开一种基于改进YOLOv3模型的芯片缺陷检测方法属于图像检测领域。本发明解决了在复杂情况下,芯片缺陷检测精度低的问题。首先,获取不同的芯片缺陷的图像,构建数据集,并划分训练集和测试集;其次,改进EMO(Efficient Model,高效模型)模块,将模型内部的SE(Squeeze and Excitation,压缩和激励)注意力更新为CA(CoordinateAttention,坐标注意力);然后,使用改进的EMO更换原YOLOv3的Darknet‑53主干网络;接着,采用SIoU(Smoothed Intersection over Union,平滑交并比)损失函数作为原YOLOv3网络模型中的损失函数,使用改进后的YOLOv3模型对数据集进行训练得到芯片缺陷检测模型;最后,利用训练好的模型进行检测。该模型能够增强网络学习特征的表达能力,提高模型的准确度和实时性,还能够在复杂情况下实现对芯片缺陷的精确检测。
-
公开(公告)号:CN116609326A
公开(公告)日:2023-08-18
申请号:CN202310429823.5
申请日:2023-04-19
Applicant: 哈尔滨理工大学
IPC: G01N21/84 , G01N33/483 , G06F17/15
Abstract: 本发明公开了一种基于吸收率的生物组织光学特性参数空间频域成像方法,包括如下步骤:设置生物组织蒙特卡洛仿真参数;通过蒙特卡洛仿真和一维零阶汉克尔变换构建基于吸收率的生物组织光学特性参数查找表;针对参考仿体投射余弦光照明图案并采集条纹图像;针对所述条纹图像进行傅里叶变换、频域滤波和傅里叶逆变换得到直流分量和交流分量调制度;将参考仿体置换为被测生物组织体,重复前述2个步骤得到直流分量和交流分量调制度;计算直流和交流吸收率测量值;计算吸收率欧氏距离的最小值,查表得到吸收系数和约化散射系数测量结果,得到光学特性参数图像。本发明以生物组织吸收率为光学特性参数反演的出发点,明显提高成像灵敏度、减小反演误差。
-
公开(公告)号:CN115841599A
公开(公告)日:2023-03-24
申请号:CN202211703105.4
申请日:2023-02-23
Applicant: 哈尔滨理工大学
IPC: G06V10/764 , G06V10/77 , G06V10/80 , G06V10/82 , G06V20/10 , G06N3/0464 , G06N3/08
Abstract: 本发明新型耦合共享的高光谱与LiDAR数据协同分类方法属于图像分类技术领域;该方法依次执行以下步骤:步骤a、使用主成分分析方法去除高光谱图像的光谱冗余,然后送入空洞空间金字塔池化(Atrous Spatial Pyramid Pooling,ASPP)模块提取多分辨率特征;步骤b、将LiDAR数据输入到另一支路的ASPP模块,提取多分辨率特征;步骤c、将高光谱和LiDAR两支路的多分辨率特征分别输入各支路的三个可分离卷积模块中,其中两支路之间第二个和第三个的可分离卷积模块进行参数共享;步骤d、将高光谱和LiDAR数据两支路的特征分别输入各支路的多头自注意力(Multi‑Head Self‑Attention,MHSA)中来提取更加有效的信息;步骤e、将MHSA加权后的高光谱和LiDAR特征进行融合,并使用softmax进行分类。本发明利用ASPP、可分离卷积耦合共享机制和MHSA组成特征提取模块,利用特征融合机制实现不同传感器数据之间的信息互补,进一步增强学习特征的辨别能力,提高地物的分类精度。
-
公开(公告)号:CN115524311A
公开(公告)日:2022-12-27
申请号:CN202211168313.9
申请日:2022-09-23
Applicant: 哈尔滨理工大学
Abstract: 本发明基于斜条纹图案的表面漫反射率和三维形貌一体成像方法属于结构光三维成像技术领域;该方法通过生成不同频率的余弦斜条纹图案,在漫反射板和样品上分别形成固定光波下余弦斜条纹图像,再进行傅里叶变换得到图像频谱,并进行滤波和傅里叶逆变换,得到直流分量和一阶频谱分量的空域表达形式,进而得到图像像素点所对应样品表面漫反射率和包裹相位,对包裹相位进行展开得到绝对相位并计算图像像素点所对应的样品表面三维坐标,最后实现样品表面的漫反射率和三维形貌一体成像;本发明同采用正条纹图案的传统傅里叶变换三维成像方法相比,提高了样品表面三维坐标的测量准确度,并实现了样品表面漫反射测量,进而实现漫反射率和三维形貌一体成像。
-
公开(公告)号:CN113532330B
公开(公告)日:2022-10-04
申请号:CN202110999148.0
申请日:2021-08-28
Applicant: 哈尔滨理工大学
IPC: G01B11/25
Abstract: 一种相位格雷码三维测量方法属于结构光三维测量技术领域。该方法包括以下步骤:首先,生成相位格雷码的四步余弦相移条纹图案;然后,依次投射各位余弦相移条纹图案并同步采集余弦相移条纹图像;第三,根据四步相移法获取余弦相移条纹图像的相位码字;第四,将相位码字转换为相位格雷码字;第五,将相位格雷码字转换为二进制码字;第六,将二进制码转换为十进制码;最后,根据三角法使用十进制码计算被测表面三维坐标、形成三维图像。本发明有益效果在于:相比格雷码三维测量方法,本发明方法具有更强的抗干扰能力,有效地减少了强度干扰带来的解码误差及其导致的测量误差,明显提升了三维成像效果。
-
公开(公告)号:CN114863158A
公开(公告)日:2022-08-05
申请号:CN202210018133.6
申请日:2022-01-08
Applicant: 哈尔滨理工大学
IPC: G06V10/764 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明一种基于重参数化MLP的高光谱图像分类方法属于图像分类技术领域;该方法依次执行以下步骤:输入高光谱图像、获得样本集、确定训练样本集与测试样本集、高光谱样本的切片化处理、构建重参数化MLP模型,并利用训练数据对重参数化MLP模型进行训练、进行高光谱图像分类;本发明将全连接层替换部分卷积层中,以提供全局表征能力和位置感知能力,最后通过重参数化的方法,将卷积层和全连接层重参数化为一个全连接层,赋予了全连接层不具备的捕捉局部信息能力,在对高光谱图像分类时提升了分类精度和推理速度,为后续的深度学习算法在高光谱图像分类研究以及工程应用提供新的思路。
-
公开(公告)号:CN111309956B
公开(公告)日:2022-06-24
申请号:CN202010149894.6
申请日:2017-02-13
Applicant: 哈尔滨理工大学
IPC: G06F16/583 , G06F16/55 , G06V10/74 , G06V10/762 , G06V10/80 , G06K9/62
Abstract: 本发明一种面向图像检索的提取方法,包括提取待检索图像及图像库SIFT特征,包括以下步骤:首先构建待检索图像及图像库高斯差分尺度函数,然后检测高斯差分尺度空间极值点,最后除去边缘不稳定的特征点,生成SIFT描述符;将本发明提取方法应用于基于词汇树信息融合与豪斯多夫距离结合的图像检索方法中,能够为提高图像检索准确率,并适用于复杂背景的图像检索提供理论基础。
-
公开(公告)号:CN114429565A
公开(公告)日:2022-05-03
申请号:CN202210018149.7
申请日:2022-01-08
Applicant: 哈尔滨理工大学
IPC: G06V10/764 , G06V10/771 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明一种基于跨场景自适应学习的高光谱图像分类方法属于图像处理技术领域;该方法依次执行输入待分类的原始高光谱数据集、对输入的高光谱图像原始数据集进行划分、对SD和TD进行特征提取,输入至改进的深度可分离嵌入模型,获得每层输出的特征图、将深度可分离嵌入模型的输出进行聚类、将聚类后的输入样本输入到判别器模型中,并区分SD和TD,获得只含有TD的嵌入空间、通过改进的加权K近邻分类器WKNN进行分类;本发明可以减少分类模型对样本的依赖,并增强模型对数据类别不平衡问题的处理能力,明显提高了分类精度,为实现小样本或无样本情况下高光谱图像精准分类的研究以及工程应用提供新的思路。
-
-
-
-
-
-
-
-
-