-
公开(公告)号:CN111582483B
公开(公告)日:2022-12-13
申请号:CN202010409546.8
申请日:2020-05-14
Applicant: 哈尔滨工程大学
Abstract: 本发明的目的在于提供基于空间和通道联合注意力机制的无监督学习光流估计方法,首先构建一种融合空洞卷积的新型特征金字塔网络,并利用其提取包含更多运动信息的多尺度特征。之后基于空间和通道联合注意力机制构建光流估计网络,使网络能够学习到更有针对性的运动信息。最后基于正反一致性校验和Census变换构造遮挡感知的无监督损失函数,并利用其对网络进行无监督训练,得到性能更优的无监督光流估计模型。
-
公开(公告)号:CN108021857B
公开(公告)日:2021-12-21
申请号:CN201710717257.2
申请日:2017-08-21
Applicant: 哈尔滨工程大学
Abstract: 本发明公开了一种基于无人机航拍图像序列深度恢复的建筑物检测方法,属于建筑物检测技术领域。具体内容包括:无人机搭载单目相机采集图像序列;利用飞机的运动信息以及获取到的图像序列的空域和时域的关系,恢复出图像的视差;将视差转换为深度,人工的设定深度阈值来分割建筑物。本发明可以有效地估计出图像的深度,利用深度检测出建筑物。本发明首次使用了无人机图像序列深度恢复的方法,能够对建筑物进行有效的检测。
-
公开(公告)号:CN111582483A
公开(公告)日:2020-08-25
申请号:CN202010409546.8
申请日:2020-05-14
Applicant: 哈尔滨工程大学
Abstract: 本发明的目的在于提供基于空间和通道联合注意力机制的无监督学习光流估计方法,首先构建一种融合空洞卷积的新型特征金字塔网络,并利用其提取包含更多运动信息的多尺度特征。之后基于空间和通道联合注意力机制构建光流估计网络,使网络能够学习到更有针对性的运动信息。最后基于正反一致性校验和Census变换构造遮挡感知的无监督损失函数,并利用其对网络进行无监督训练,得到性能更优的无监督光流估计模型。
-
公开(公告)号:CN107665603B
公开(公告)日:2020-06-16
申请号:CN201710795417.5
申请日:2017-09-06
Applicant: 哈尔滨工程大学
Abstract: 本发明公开了一种判定车位占用的实时检测方法,属于机器视觉技术领域,具体涉及一种通过俯视的深度图融合卷积神经网络的检测方法来判定车位是否被正确占用的实时检测方法。其具体包括搭建双目立体相机、收集车辆样本和非车辆样本、设计并训练以卷积神经网络CarNet为基础的车辆检测模型、人工标定监控车位在相机图像中位置、得到监控场景下的深度图、对深度图分割初步得到车辆区域同时利用CarNet检测模型检测车辆、融合深度图与卷积神经网络结果得到可靠车辆检测框以及判定车位是否占用等步骤。本发明可广泛用于加油站、地下停车场等半露天或室内停车场,可准确输出车位占用情况,具有实施成本低,工作效率高、自动化能力强等优点,具有广阔的发展前景。
-
公开(公告)号:CN114154017B
公开(公告)日:2024-08-23
申请号:CN202111423613.2
申请日:2021-11-26
Applicant: 哈尔滨工程大学
IPC: G06F16/783 , G06V20/52 , G06V20/40 , G06V40/10 , G06V10/44 , G06V10/82 , G06N3/0464 , G06N3/045 , G06N3/088 , G06N3/048
Abstract: 本发明属于计算机视觉技术领域,具体涉及一种无监督可见光与红外双向跨模态行人搜索方法。本发明设计了模态自适应动态视觉Transformer网络,通过同一网络同时处理可见光和红外两种不同模态的图像,满足模态差异性和一致性的要求;设计了查询引导的无监督行人建议生成模块,并利用基于对比学习的双向跨模态匹配损失函数,实现了无监督的可见光‑红外双向跨模态行人搜索。本发明解决了现有行人搜索方法在不良光照条件下的局限性以及数据集标注问题,能够实现可见光‑红外双向跨模态行人搜索,即,给定可见光行人图像搜索到出现对应行人的红外场景图像并获取其所在位置,给定红外行人图像搜索到出现对应行人的可见光场景图像并获取其所在位置。
-
公开(公告)号:CN109086807B
公开(公告)日:2022-03-18
申请号:CN201810779483.8
申请日:2018-07-16
Applicant: 哈尔滨工程大学
IPC: G06V10/774 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明提供了一种基于卷积神经网络的半监督学习光流方法,属于网络设计领域。本发明提供的方法可以针对带标签和无标签的混合数据进行训练,并设计一种遮挡感知损失函数,将用于监督学习的端点误差代价函数与用于非监督学习的数据项和平滑项相结合,构建一种半监督学习光流模型,在网络架构上采用堆叠网络结构,在卷积层引入空洞卷积来增大感受野,并设计遮挡感知层来估计遮挡区域,该网络能够端到端地进行半监督光流学习。本发明提供的方法能够提高光流估计精度,并且还提出一种遮挡感知损失函数来半监督训练网络,在网络架构上设计一种堆叠网络结构从而进一步提升网络性能。
-
公开(公告)号:CN107341815B
公开(公告)日:2020-10-16
申请号:CN201710404056.7
申请日:2017-06-01
Applicant: 哈尔滨工程大学
Abstract: 本发明提供的是一种基于多目立体视觉场景流的剧烈运动检测方法。一:利用标定好的多目相机获取多组图像序列;二:对图像序列进行预处理;三:场景流能量泛函数据项的设计;四:场景流能量泛函平滑项的设计;五:能量泛函地优化求解;从步骤二中得到的图像金字塔最低分辨率图像开始使用计算模型计算;六:场景流运动区域的聚类;七:构建运动方向离散程度评估模型,判断是否是剧烈运动;八:构建运动区域动能大小评估模型;九:设定阈值,且连续n帧满足评估条件时则引发报警。本发明采用的是基于多目立体视觉的场景流估计,通过已经标定好的多目相机获取来自同一场景的多组图像序列。利用3维场景流可以有效地进行剧烈运动检测。
-
公开(公告)号:CN107665603A
公开(公告)日:2018-02-06
申请号:CN201710795417.5
申请日:2017-09-06
Applicant: 哈尔滨工程大学
Abstract: 本发明公开了一种判定车位占用的实时检测方法,属于机器视觉技术领域,具体涉及一种通过俯视的深度图融合卷积神经网络的检测方法来判定车位是否被正确占用的实时检测方法。其具体包括搭建双目立体相机、收集车辆样本和非车辆样本、设计并训练以卷积神经网络CarNet为基础的车辆检测模型、人工标定监控车位在相机图像中位置、得到监控场景下的深度图、对深度图分割初步得到车辆区域同时利用CarNet检测模型检测车辆、融合深度图与卷积神经网络结果得到可靠车辆检测框以及判定车位是否占用等步骤。本发明可广泛用于加油站、地下停车场等半露天或室内停车场,可准确输出车位占用情况,具有实施成本低,工作效率高、自动化能力强等优点,具有广阔的发展前景。
-
公开(公告)号:CN106952291A
公开(公告)日:2017-07-14
申请号:CN201710151289.0
申请日:2017-03-14
Applicant: 哈尔滨工程大学
IPC: G06T7/285
CPC classification number: G06T2207/10016 , G06T2207/10024 , G06T2207/30236
Abstract: 本发明提供的是一种基于3维结构张量各向异性流驱动的场景流车流量统计与测速方法。利用多目立体相机获取图像序列;构建场景流能量泛函;构建基于HSV空间的色彩梯度恒常假设,多视角约束的数据项;设计基于3维扩散张量各向异性流驱动的场景流平滑项;极小化能量函数,得到对应的欧拉‑拉格朗日方程;将得到的场景流分量组合成一组幅度图,利用基于变分全局熵自适应水平集图像分割方法,对图像进行分割处理,得到运动目标轮廓;根据前后帧计算得到的闭合曲线及场景流,判断前后帧中分割得到的目标是否为同一个,并进行目标数量统计;根据移动目标的形心和计算出的场景流,计算对应的实际速度。本发明的方法主要用于智能交通管理。
-
公开(公告)号:CN108932725B
公开(公告)日:2021-10-26
申请号:CN201810589261.X
申请日:2018-06-08
Applicant: 哈尔滨工程大学
Abstract: 本发明公开了基于卷积神经网络的场景流估计方法,属于计算机视觉领域。该方法将卷积神经网络与场景流估计相结合,可以从大量无标注的数据集中无监督学习得到场景流,进而提出了一种新的网络架构,命名为SF‑Net,端到端地进行场景流无监督学习,该模型能够从输入的图像中直接提取出场景流。在估计场景流时,通过使用预先训练好的网络模型,只需通过前向计算就可以得到场景流,能够满足实时应用要求。
-
-
-
-
-
-
-
-
-