一种三维点云中多种几何基元自动识别方法

    公开(公告)号:CN106228539A

    公开(公告)日:2016-12-14

    申请号:CN201610546455.2

    申请日:2016-07-12

    Inventor: 王亮 申超 吴至秋

    CPC classification number: G06T7/0002 G06T2207/10028

    Abstract: 本发明公开一种三维点云中多种几何基元自动识别方法,其包括,对输入的三维点云进行预处理,即体素滤波,基于Kd树建立邻域结构并估计点的法向量;对点云进行邻域关系的确定,再对点云进行抽样;计算样本点邻域的协方差矩阵,分析三个特征值的大小关系,根据共面规则生成相应的初始几何基元模型;根据初始几何基元的模型分别构建相应的能量方程,按照能量优化框架进行平面、球面和柱面能量计算;循环迭代以上步骤,对多种几何基元的能量进行最小化,利用最优化算法求解得到最优意义下的几何基元参数,从而实现几何基元模型参数的精化,最终输出多种几何基元的参数和内点。采用本发明的技术方案,不仅具有应用范围广、参数估计准确、抗干扰能力强等特点,而且大大提高了对三维点云的识别与分析能力。

    一种基于归一化全局误差损失函数的神经辐射场三维重建方法

    公开(公告)号:CN119169195A

    公开(公告)日:2024-12-20

    申请号:CN202411322366.0

    申请日:2024-09-23

    Inventor: 王亮 叶东衡

    Abstract: 本发明公开了一种基于归一化全局误差损失函数的神经辐射场三维重建方法。所述方法如下:Instant‑NGP是一种快速的NeRF算法,要实现高质量重建,仍需经过大量迭代步数来训练神经网络。S3im在仅考虑逐点误差的损失函数中加入图块对之间的整体误差。受S3im的启发,我们将图块概念引申到线程块,设置固定线程数量的自定义线程块,计算线程块的归一化全局误差,然后将其引入到原逐点误差的损失函数中。经过大量实验,在较少的迭代步数时,得到了比原版Instant‑NGP更好的视觉效果,对于线条和连续性结构等部分的重建有着令人惊叹的效果,PSNR和UQI的值均有提升。

    一种基于对抗性训练的多视图立体深度估计方法

    公开(公告)号:CN112184731B

    公开(公告)日:2024-05-28

    申请号:CN202011037998.4

    申请日:2020-09-28

    Abstract: 本发明公开了一种基于对抗性训练的多视图立体深度估计方法。在对抗性训练网络中,生成网络学习图像与其对应深度图之间的映射,判别网络将学习区分深度图是来自生成模块还是基准深度。训练时,结合生成损失函数和交叉熵对抗损失函数,训练整个网络。本发明通过对抗性训练来提高多视图立体深度估计的深度学习能力,通过生成对抗网络GAN在图像深度方向收集空间和时间上的上下文信息,从而允许网络结合更多的全局信息。本发明的对抗性训练网络利用生成模块和判别模块的对抗性训练,采用梯度惩罚作为一种软约束的对抗损失函数,改进了原始生成对抗网络训练过程,显著减少了网络训练和测试期间的内存占用和运行时间,提高了多视图立体深度预测精度。

    平滑相机运动场景下的动态三维重建方法

    公开(公告)号:CN116681819A

    公开(公告)日:2023-09-01

    申请号:CN202310401561.1

    申请日:2023-04-16

    Inventor: 王亮 李永玮

    Abstract: 基于压缩感知在平滑相机运动场景下的动态三维重建方法,属于三维重建领域。本发明(1)结合压缩感知原理,二维投影在离散余弦变换域下的稀疏表示可以用于精确地恢复三维点轨迹。为了加强系数稀疏性,对系数施加L1范数约束作为惩罚项,构成新的重建函数,提高了动态三维重建精度;(2)新的重建函数由原来的欠定方程组转变为凸函数这一精简问题,为此在凸优化算法中设计了全新的阈值调整环节,使其配合L1范数惩罚项能够快速准确地求得稀疏解;(3)通过定义重建精度判定标准,设计新的交叉验证环节,能够为每个重建点自适应选择最优的轨迹基向量组合和稀疏约束权重,满足良好的重建关系,实现该重建函数下的最优重建。

    一种基于深度霍夫网络的注意力方案和条带卷积语义线检测的方法

    公开(公告)号:CN116563682A

    公开(公告)日:2023-08-08

    申请号:CN202310532781.8

    申请日:2023-05-11

    Inventor: 王亮 章航

    Abstract: 一种基于深度霍夫网络的注意力方案和条带卷积语义线检测的方法,属于图像目标识别领域。包括以下步骤:调整数据集图片尺寸,将预处理后的图片输入卷积模型进行特征提取、注意力机制,多尺度特征融合,得到输出的特征结果。不同尺度的特征进行霍夫变换并进行融合特征回归预测得到识别结果;条带卷积替换原先的空间卷积层以得到输入图像识别目标的远程相关语义信息;对前向网络的图片进行条带状池化层和空间池化层混合池化层池化;特征金字塔网络添加通道注意力模块帮助对图片分区的重要性进行建模,以减少输入图像的冗余信息对识别结果的影响;设计Ghost卷积轻量化网络减少网络的计算量。相较于常规语义线检测方法模型参数量更少,识别准确率更高。

    一种基于全局注意力的安全帽配戴检测方法

    公开(公告)号:CN114463677A

    公开(公告)日:2022-05-10

    申请号:CN202210062829.9

    申请日:2022-01-19

    Inventor: 王亮 孙李程

    Abstract: 一种基于全局注意力的安全帽配戴检测方法,属于安全帽配戴检测系统领域,包括步骤:(1)预处理,(2)构建全局注意力的目标框类别分类和预测框位置回归任务的神经网络,(3)训练神经网络,(4)安全帽配戴检测。本发明针对施工现场复杂,容易忽略重要特征信息,检测精度低无法达到实时性的问题,(1)提出了一种相关卷积聚合模块框架,以增强上下文特征信息的能力;(2)利用基于全局注意力的上下文信息聚合模块以增强特征融合与聚合上下文特征的能力;(3)通过自注意力局部特征提取模块使网络模型可以更多提取的特征中安全帽特征信息以及上下文整体信息;(4)在全局检测网络模块联合了全局注意力,保留高频特征信息细化网络模型。

    基于曼哈顿假设下室内环境的相机旋转估计方法

    公开(公告)号:CN114463406A

    公开(公告)日:2022-05-10

    申请号:CN202210090415.7

    申请日:2022-01-25

    Inventor: 王亮 赵德运

    Abstract: 一种基于曼哈顿结构假设下室内场景中相机旋转运动估计的方法,属于计算机视觉领域,本发明(1)采用新的方法来进行平面拟合,从室内环境深度图片的三维点云数据中随机选取三个点生成平面模型,通过对模型进行顺序概率比测试和LO‑RANSAC优化,得到精确的主导平面;(2)从RGB图片中检测直线,将直线投影到高斯球面上,得到投影后的大圆及大圆的法向量,同时将主导平面也以法向量的形式投影到高斯球面上,并与直线投影的法向量做叉乘,以此来确定曼哈顿坐标系的结构;(3)提出了一个代价函数,对曼哈顿坐标系的结构进行优化,得到更稳定准确的结果;(4)通过曼哈顿坐标系与相机坐标系之间的旋转矩阵间接计算出相机的旋转运动。

    融合双目视觉和2D激光雷达的室外定位方法

    公开(公告)号:CN114323038A

    公开(公告)日:2022-04-12

    申请号:CN202111646017.0

    申请日:2021-12-29

    Inventor: 王亮 刘诤轩

    Abstract: 融合双目视觉和2D激光雷达的室外定位方法,属于基于先验地图的机器人或自动驾驶汽车精确定位领域。本发明(1)将双目视觉作为里程计提供帧间的相对位姿,将一个局部时间窗口内的2D激光雷达数据融合成一幅局部子图;(2)利用DS证据理论对局部子图中的时态信息进行融合以消除局部子图中的动态噪音;(3)利用基于反向组合算法的地图匹配方式,将局部子图与预先构建的先验地图进行匹配,从而得到先验地图与局部子图之间的相对位姿;(4)根据匹配结果对局部子图的位姿进行校正,将校正后的位姿用于更新轨迹以消除双目里程计所产生的累积误差。

    一种基于图卷积神经网络的三维点云自动分类方法

    公开(公告)号:CN112488210A

    公开(公告)日:2021-03-12

    申请号:CN202011398492.6

    申请日:2020-12-02

    Abstract: 一种基于图卷积神经网络的三维点云分类方法,用于服务型机器人抓取三维物体过程中对复杂的物体实现自动分类识别,便于根据类别信息确定抓取位置进行抓取。属于计算机视觉的三维感知和机器人导航技术领域。包括以下步骤:(1)对三维点云进行预处理;(2)构建点云分类网络;(3)训练所构建的网络;(4)利用训练完成的网络进行分类测试。本发明的优点在于:(1)采用图卷积神经网络进行局部特征学习,增强网络对局部拓扑结构信息的学习能力;(2)对输入的点云进行全局特征学习,增强网络对上下文语义的理解。将局部特征和全局特征相聚合,再利用全连接层输出每个点云的分类得分,相较于现有网络具有更高的分类精度。

Patent Agency Ranking