基于深度学习的无人机图像对齐方法、电子设备和存储介质

    公开(公告)号:CN115131414A

    公开(公告)日:2022-09-30

    申请号:CN202210708805.6

    申请日:2022-06-22

    Abstract: 本发明公开了一种基于深度学习的无人机图像对齐方法、电子设备和存储介质,所述方法包括:构建伪造无人机透视变换数据集,对数据集进行裁剪处理,获得输入图像的灰度图像、横坐标和纵坐标的位置偏移,构建基于编码器与解码器的神经网络,并使用残差网络将浅层特征向深层特征进行补充,并添加了通道注意力机制,使通道信息更丰富表达,并使用RANSAC方法进行后处理,增强了对于透视矩阵估计的鲁棒性;本发明无需人工标注,便可实现透视矩阵的估计,从而实现无人机图像的对齐,并在不同光照,天气,图像噪声干扰下,鲁棒地将无人机图像进行对齐。

    一种基于图卷积网络的人体行为识别方法及系统

    公开(公告)号:CN110796110B

    公开(公告)日:2022-07-26

    申请号:CN201911070446.0

    申请日:2019-11-05

    Abstract: 本发明公开了一种基于图卷积网络的人体行为识别方法及系统,识别方法包括:从包含人体行为的图像中提取人体骨架信息,获取人体关节点位置信息序列,构建人体骨架的任意长度拓扑图序列;通过基于拓扑可学习图卷积的时空图卷积网络对拓扑图序列进行特征提取和拓扑结构的自适应演化,得到融合局部时空特征的节点新特征和具有新拓扑结构的拓扑图序列;通过图卷积长短期记忆神经网络进行特征提取;利用全局池化操作得到全局时空特征;通过分类器基于全局时空特征进行人体行为识别。本发明直接学习整个图的特征,将图卷积中的权重矩阵扩大到整个拓扑图结构,学习图中任意两节点之间的关系,而不受拓扑结构的限制,识别准确率高。

    一种基于像素级噪声标签监督的光场显著性目标检测方法

    公开(公告)号:CN114549863A

    公开(公告)日:2022-05-27

    申请号:CN202210447954.1

    申请日:2022-04-27

    Abstract: 本发明公开了一种基于像素级噪声标签监督的光场显著性目标检测方法,包括以下步骤:S1、基于全焦图像及其对应的焦堆栈构建实验数据;S2、通过实验数据交互式引导融合网络,获得全焦图像初始噪声预测和光场焦堆栈图像初始噪声预测;S3、通过全焦图像初始噪声预测和光场焦堆栈图像初始噪声预测构建像素遗忘矩阵,得到融合后的最终预测显著性映射;S4、对融合后的最终预测显著性映射进行跨场景的噪声惩罚损失。本发明通过挖掘高维度光场数据中非常丰富的场景信息来引导和辅助显著性物体的检测,充分利用噪声标签中可用的显著性信息并减小噪声信息的置信度,有效地降低了显著性目标检测的预实验成本。

    基于自然语言描述的三维场景目标检测建模及检测方法

    公开(公告)号:CN113034592B

    公开(公告)日:2021-08-31

    申请号:CN202110251422.6

    申请日:2021-03-08

    Abstract: 本发明公开了一种基于自然语言描述的三维场景目标检测的建模及检测方法。方法包括:①设计语言先验图网络,用于将生成的名词短语及关系短语进行图表示;②构建点云场景中三维目标化外接候选框初始化预测网络;③基于语言先验图更新后的名词短语特征进行引导,对三维目标初始化候选框进行冗余裁剪及更新;④构建三维目标候选框视觉关系图网络;⑤基于更新后的名词短语特征和关系短语特征,分别与视觉关系图的节点和边进行相似性得分匹配,定位最终的三维目标。本发明通过构建语言先验图和视觉关系图,高效地捕获全局上下文依赖关系,同时还开发了交叉跨模态的图匹配策略,避免增加计算量的同时有效地提升大规模三维点云场景的目标定位精度。

    一种基于图卷积网络的人体行为识别方法及系统

    公开(公告)号:CN110796110A

    公开(公告)日:2020-02-14

    申请号:CN201911070446.0

    申请日:2019-11-05

    Abstract: 本发明公开了一种基于图卷积网络的人体行为识别方法及系统,识别方法包括:从包含人体行为的图像中提取人体骨架信息,获取人体关节点位置信息序列,构建人体骨架的任意长度拓扑图序列;通过基于拓扑可学习图卷积的时空图卷积网络对拓扑图序列进行特征提取和拓扑结构的自适应演化,得到融合局部时空特征的节点新特征和具有新拓扑结构的拓扑图序列;通过图卷积长短期记忆神经网络进行特征提取;利用全局池化操作得到全局时空特征;通过分类器基于全局时空特征进行人体行为识别。本发明直接学习整个图的特征,将图卷积中的权重矩阵扩大到整个拓扑图结构,学习图中任意两节点之间的关系,而不受拓扑结构的限制,识别准确率高。

    一种基于人体骨架运动信息的人体行为预测方法

    公开(公告)号:CN105320944B

    公开(公告)日:2019-09-27

    申请号:CN201510698117.6

    申请日:2015-10-24

    Abstract: 本发明公开了一种基于人体骨架运动信息的人体行为预测方法,包括以下步骤:利用从RGB‑D图像中提取人体骨架信息,分肢体计算各关节点的归一化相对方位特征;利用基于特征序列势差的分割方法对特征序列进行动态分割,得到姿态特征子序列和动作特征子序列;从姿态特征子序列和动作特征子序列中提取关键姿态和原子动作,构建基于关键姿态和原子动作的多层图模型;提取多层图模型中蕴含的人体子行为模式,构建人体子行为模式的上下文概率统计模型;进行人体子行为模式的识别与预测;本发明对不同个体的形体差异、空间位置差异等具有强鲁棒性,对同类行为内不同个体的动作差异性具有强泛化能力,对不同类行为间的动作相似性具有强识别能力。

    一种基于复合多边形标志引导的无人机垂直降落方法

    公开(公告)号:CN109885086A

    公开(公告)日:2019-06-14

    申请号:CN201910179487.7

    申请日:2019-03-11

    Abstract: 本发明涉及无人机和机器视觉领域,具体是一种基于复合多边形标志引导的无人机垂直降落方法,包括以下步骤:(1)设置复合多边形标志;(2)无人机对拍摄的降落区域图像进行预处理;(3)无人机获取二值化边缘信息图像的轮廓信息;(4)无人机对二值化边缘信息图像的轮廓信息进行筛选;(5)无人机计算多边形轮廓的像素长度和中心点坐标;(6)无人机确定轮廓组合方式并识别复合多边形标志;(7)无人机计算其与标志物的相对坐标;(8)无人机降落控制;(9)无人机降落调整。本发明实现了无人机对特定目标的锁定、跟踪和精确的垂直降落等功能。

    基于衰减权重的数据分类方法

    公开(公告)号:CN109739844A

    公开(公告)日:2019-05-10

    申请号:CN201811599413.0

    申请日:2018-12-26

    Abstract: 本发明公开了一种基于衰减权重的数据分类方法,本发明主要解决现有传统的分类方法只能接受数值类型的数据集,忽略数据本身的时间特性,容易过拟合,分类准确率不高的问题。其实现步骤是:1、获取训练样本和预测样本;2、清洗数据;3、生成类型转化数据集;4、标准化处理;5、生成训练集和预测集;6、计算训练集中每个样本的衰减权重;7、利用特征选择方法训练极限梯度增强XGBoost的多分类器;8、对预测集中每个样本进行分类。本发明利用数据本身的时间特性信息赋予样本衰减权重,能够接受更多类型的数据,有效地提高了分类的准确率,可应用于复杂多变的业务场景下的数据分类。

    基于迭代相关性噪声细化的单向分布式视频解码方法

    公开(公告)号:CN108712653A

    公开(公告)日:2018-10-26

    申请号:CN201810545760.9

    申请日:2018-05-25

    Abstract: 本发明公开了一种基于迭代相关性噪声细化的单向分布式视频解码方法,具体步骤:(1)对分块帧进行离散余弦变换、量化和提取比特平面;(2)估计编码码率;(3)对比特平面进行LDPCA编码;(4)对边信息帧和运动补偿残差帧进行离散余弦变换和提取比特平面;(5)估计相关性噪声;(6)对待解码比特平面进行LDPCA解码;(7)利用更新后的重构系数值细化残差系数值;(8)通过离散余弦反变换,得到最终的重构WZ帧。本发明在迭代解码的基础上,通过更新上一次解码得到的重构系数细化残差系数,更新相关性噪声分布。本发明提高了相关性噪声估计精度和重构质量,解决了因编码端码率欠估计导致重构质量退化的问题。

    一种基于OpenCL的图像去噪算法的并行优化方法

    公开(公告)号:CN104992421B

    公开(公告)日:2018-08-17

    申请号:CN201510400551.1

    申请日:2015-07-09

    Abstract: 本发明公开了一种基于OpenCL的图像去噪算法的并行优化方法,根据图像分层的思想,通过联合双边滤波算法和联合WLS算法将图像分成高对比度的基础层和低对比度的细节层,接着使用Stockham FFT对细节层进行去噪处理,最后通过变化域谱收缩和图像相加方法将图像还原,达到去噪的效果。本发明针对基础层获取和细节层去噪两部分执行函数处理数据量大,但其数据并行性非常高的特点,使用OpenCL平台模型,在GPU上实现图像去噪算法的并行计算,最后对计算过程中的细节方面做了改进,如使用局部内存、选择合适的工作组大小和使用并行归约等,最终实现的去噪算法加速比能达到30倍以上,极大地提高了算法的实用性。

Patent Agency Ranking