-
公开(公告)号:CN118521623A
公开(公告)日:2024-08-20
申请号:CN202410562029.2
申请日:2024-05-08
申请人: 华中科技大学
摘要: 本发明公开了一种基于密集场景匹配的深度单应估计方法,属于计算机视觉领域,该方法提出了一种从粗到细的深度单应估计网络,该网络由三个子模型构成,结合了线性单应估计和非线性单应估计。前两个子模型进行线性单应估计从而粗对齐两幅图像,最后一个子模型进行非线性单应估计从而通过网格变形的方式精对齐两幅图像。这种从粗到细的估计方式能够在有限的网络容量内进一步提高图像对齐精度。进一步地,该方法通过密集场景匹配模块来显式的估计四角点偏移,考虑了图像特征点之间的相关性,从而融入了匹配信息,更加合理的建立图像和角点偏移的联系,避免了网络过拟合现象同时提高了网络对图像细节的处理能力。
-
公开(公告)号:CN112947526B
公开(公告)日:2022-09-27
申请号:CN202110273448.0
申请日:2021-03-12
申请人: 华中科技大学
摘要: 本发明公开了一种无人机自主降落方法和系统,属于计算机视觉领域,方法包括:利用无人机数据采集设备实时采集图像传递给后端服务器;当无人机高度较高时,后端服务器利用深度学习检测算法对停机标志进行检测,得到无人机位置偏移量,完成对无人机位置粗调,粗调完成后无人机下降一定高度,反复多次粗调;当无人机高度较低时,后端服务器利用位姿精调算法对无人机进行精调,位姿精调完成后下降一定高度,反复多次精调;当无人机高度小于阈值后,停止位姿调节,直接降落,完成无人机自主精准降落。本发明解决了传统无人机自主降落精度低,鲁棒性差的问题,满足无人机自主精准降落的实际需求,具有较高的实用价值。
-
公开(公告)号:CN109815906B
公开(公告)日:2021-04-06
申请号:CN201910072743.2
申请日:2019-01-25
申请人: 华中科技大学
摘要: 本发明公开了一种基于分步深度学习的交通标志检测方法及系统,方法包括对输入的高分辨率图像进行降采样,将降采样图像划分为多个图像块;然后进行区域分割得到二值标签图像;提取连通子区域,并对每个子区域进行膨胀处理;在原图中截取每个子区域所对应的图像信息并缩放到指定大小,利用卷积神经网络对子图像进行交通标志检测;最后,将所有子区域中的检测结果映射到同一张输入图像中,利用非极大抑制过滤得到最终的检测结果。系统包括采集模块、分割模块、处理模块和检测模块。本发明先对图像进行区域分割来确定可能包含目标的区域,能够利用较短的时间过滤掉绝大部分无用区域,因而能够大大提高交通标志检测的效率。
-
公开(公告)号:CN110322511B
公开(公告)日:2021-03-26
申请号:CN201910573369.4
申请日:2019-06-28
申请人: 华中科技大学
IPC分类号: G06T7/73 , G06T7/10 , G06T7/50 , G06F16/587
摘要: 本发明公开了一种基于物体和平面特征的语义SLAM方法和系统,属于计算机视觉技术领域,其中方法包括:获取场景的RGB‑D图像流,利用RGB‑D图像流进行逐帧跟踪得到关键帧图像;利用关键帧图像构建关于场景的局部地图,对关键帧图像的深度图进行平面分割得到当前平面,利用当前平面构建全局平面地图,对关键帧图像进行物体检测,得到检测框和置信度,利用检测框和置信度重建物体的点云,将检测框中的特征点归并到物体,得到全局物体地图;利用关键帧图像进行回环检测,得到回环帧,利用回环帧进行回环修正优化平面约束与物体约束,得到场景的平面地图和物体地图。本发明可以提升SLAM优化性能,并增强对环境的语义描述。
-
公开(公告)号:CN110059544B
公开(公告)日:2021-03-26
申请号:CN201910172834.3
申请日:2019-03-07
申请人: 华中科技大学
摘要: 本发明公开了一种基于道路场景的行人检测方法和系统,属于计算机视觉领域,包括:对采集图像进行感兴趣区域提取得到输入对象,并在输入对象中对目标对象进行标记得到训练数据集;将训练数据集按照目标尺度大小分为多个部分;设计与输入图像宽高比一致的矩形卷积神经网络;设计预选框初步确定目标对象所在位置;采用分组的训练数据集和预选框对矩形卷积神经网络进行分步训练,使不同特征层对相应尺度的目标对象更为敏感;最后通过训练好的行人检测模型对输入图像进行检测,将重复检测和低于设定置信度阈值的目标框删除,得到行人检测结果。本发明相对现有的行人检测算法对不同尺寸的目标具有更强的针对性,运行速度更快,检测精度更高。
-
公开(公告)号:CN110210324B
公开(公告)日:2021-01-19
申请号:CN201910383340.X
申请日:2019-05-08
申请人: 华中科技大学
摘要: 本发明公开了一种道路目标快速检测预警方法和系统,属于计算机视觉领域,方法包括:利用图像采集设备采集道路场景图像,依据目标距离从近到远的顺序从道路场景图像中提取N级感兴趣区域;按照目标距离从近到远的顺序,依次对N级感兴趣区域进行目标检测,在目标距离较近的某级感兴趣区域检测到有目标后,进行预警,并不再对后续级别感兴趣区域进行检测;其中,N≥2,所述目标距离为目标与图像采集设备之间的距离。本发明相对现有的行人、车辆等目标的检测预警算法,能够更快速准确地对出现在行车路线上的目标进行检测预警,具有较好的实用价值。
-
公开(公告)号:CN110322511A
公开(公告)日:2019-10-11
申请号:CN201910573369.4
申请日:2019-06-28
申请人: 华中科技大学
IPC分类号: G06T7/73 , G06T7/10 , G06T7/50 , G06F16/587
摘要: 本发明公开了一种基于物体和平面特征的语义SLAM方法和系统,属于计算机视觉技术领域,其中方法包括:获取场景的RGB-D图像流,利用RGB-D图像流进行逐帧跟踪得到关键帧图像;利用关键帧图像构建关于场景的局部地图,对关键帧图像的深度图进行平面分割得到当前平面,利用当前平面构建全局平面地图,对关键帧图像进行物体检测,得到检测框和置信度,利用检测框和置信度重建物体的点云,将检测框中的特征点归并到物体,得到全局物体地图;利用关键帧图像进行回环检测,得到回环帧,利用回环帧进行回环修正优化平面约束与物体约束,得到场景的平面地图和物体地图。本发明可以提升SLAM优化性能,并增强对环境的语义描述。
-
公开(公告)号:CN106652023B
公开(公告)日:2019-08-30
申请号:CN201611144797.8
申请日:2016-12-13
申请人: 华中科技大学
摘要: 本发明公开了一种大规模无序图像快速运动恢复结构的方法及系统,首先,提出了一种多层图贪心策略从图像集合中选择多个核;其次,将所有图像按照它们到核的最优重建路径进行聚类,并提出了一种分层最短路径算法寻找最优重建路径;最后,提出了一种径向融合聚类方法将一个图像聚类中的非核图像划分成平衡的子类,使其在不降低精度的同时,可以并行处理,数据划分结束后,按照分层的策略对其进行重建,重建完成后,对得到的若干个独立的子模型进行合并,最后将合并了叶子聚类模型的基模型进行合并,得到完整的模型。可以显著提高重建效率,还可以解决由图像分布不均、场景重叠不连续导致的重建精确度和完整度问题。
-
公开(公告)号:CN105427385B
公开(公告)日:2018-03-27
申请号:CN201510897594.5
申请日:2015-12-07
申请人: 华中科技大学
IPC分类号: G06T17/30
摘要: 本发明公开了一种基于多层形变模型的高保真人脸三维重建方法。所述方法以视频图像序列作为输入数据,经过光流特征点检测与跟踪,人脸特征点提取与匹配、相机标定,从而利用运动恢复结构技术恢复相机参数与相机轨迹,提出了人脸多层次形变模型,进而进行纹理映射得到目标人脸的高保真人脸三维模型。本发明将形变模型技术与运动恢复结构技术结合起来,提出了人脸多层次形变模型,能够获得与目标人脸高度相似的重建结果,同时,本发明弥补了传统运动恢复结构出现的表面噪声的缺点,又能够利用运动恢复结构提供的人脸细节,通过本发明的方法重建得到的高保真人脸模型在人脸识别、个性定制化游戏、虚拟现实和安全部门的等领域拥有广泛的应用。
-
公开(公告)号:CN107341846A
公开(公告)日:2017-11-10
申请号:CN201710473206.X
申请日:2017-06-21
申请人: 华中科技大学
CPC分类号: G06T17/005 , G06T17/20
摘要: 本发明公开了一种实时显示大规模三维重建场景的方法及设备。该方法以大规模三维重建场景的点云模型或者三角网格模型作为输入数据,经过分叉树处理构建三维场景的多层次细节模型数据,该设备的处理器读取相应的模型数据按照该方法进行处理并将处理结果实时输出至显示界面进行显示。该方法通过分叉树处理数据,处理速度为指数级,能够克服计算机内存的限制,实时的显示基于点云或者三角网格的大规模三维重建场景,并具有良好的交互功能,该方法及设备不仅仅局限于三维重建后的场景模型,对于其它的大数据量的三维点云或者三角网格模型也同样适用,具有很强的理论意义和非常广阔的应用前景。
-
-
-
-
-
-
-
-
-