基于嵌入式平台的视频压缩系统与方法

    公开(公告)号:CN119835440A

    公开(公告)日:2025-04-15

    申请号:CN202411930385.1

    申请日:2024-12-26

    Abstract: 本发明公开了一种基于嵌入式平台的视频压缩系统与方法,主要解决现有技术压缩效率低、适应性差以及计算量大导致应用受限的问题。方案包括:1)利用公开的视频数据构建样本集;2)由特征提取、运动估计、运动压缩/解压、运动补偿、残差压缩/解压以及特征重建模块构建视频压缩模型并训练;3)通过残差块剪枝对训练后的模型进行微调并做轻量化处理;4)将模型转换为部署平台支持的模型格式;5)将转换后的模型分解为压缩和解压模型,分别部署到两端的嵌入式平台中;6)采集视频并预处理后输入到编码端的压缩模型,得到二进制码流,传输至解码端的解压模型重建得到重构帧。本发明模型复杂度和计算复杂度低,能够在嵌入式设备上部署。

    基于潜在图案嵌入的自监督异构图节点分类方法

    公开(公告)号:CN118245929A

    公开(公告)日:2024-06-25

    申请号:CN202410402596.1

    申请日:2024-04-03

    Abstract: 本发明公开了一种基于潜在图案嵌入的自监督异构图节点分类方法,主要解决现有技术中异构图节点分类效果不佳的问题。包括:1)设计潜在重复图案嵌入模块,通过选择最相似的M个节点的k跳邻域构建子图序列;2)通过GCN网络捕获子图特征,构建子图特征序列;3)将子图特征序列作为Bi‑LSTM的输入,得到潜在重复图案表示;4)设计邻域结构嵌入NSE编码器从随机游走得到的序列中捕获节点的高阶邻域表示;5)通过随机策略生成负样本序列来构建对比学习损失;6)将获得的潜在重复图案表示、高阶邻域表示和节点自身特征融合得到最终的节点表示,并利用分类器实现分类。本发明能够更好地捕获信息,有效提升异构图节点分类准确率。

    基于位置与结构信息的图表示学习方法

    公开(公告)号:CN114265954B

    公开(公告)日:2023-09-19

    申请号:CN202111459096.4

    申请日:2021-12-02

    Abstract: 本发明公开了一种基于位置信息和结构信息的图表示学习方法:步骤1:获取输入图的信息,对每个节点构造一个近邻节点集;步骤2:根据每个节点的近邻节点集,构造拓扑空间的邻接矩阵,得到每个节点对应的基于结构信息的图节点特征表示;步骤3:将池化得分最高的k个节点作为位置参考点;步骤4:计算得到基于位置信息的图节点嵌入特征;步骤5:将基于结构信息的图节点嵌入特征和基于位置信息的图节点嵌入特征进行融合,得到最终的图节点特征表示。本发明的方法得到的基于位置信息和结构信息的节点嵌入包含了更充分的图特征,对下游任务起到了增益作用。该方法学习到了更加充分的节点信息,取得了良好的效果。

    一种视频图像处理的加速方法、系统、设备及存储介质

    公开(公告)号:CN116366783A

    公开(公告)日:2023-06-30

    申请号:CN202310157612.0

    申请日:2023-02-23

    Abstract: 本发明公开了一种视频图像处理的加速方法、系统、设备及存储介质,涉及图像处理技术领域。该方法包括:采集视频帧图像并对其进行格式转换;获取关键帧和参考帧;拆解网络模型为卷积层部分和后处理部分;对关键帧进行降采样处理,获取降采样图像;将降采样图像送入卷积层部分进行推理,获取预测参数图;对预测参数图进行上采样处理,获取上采样图像并将其与视频帧图像进行像素矩阵运算,获取运算结果图。本发明采用帧差法技术保证了视频图像处理的实时性;采用NEON技术和降采样技术提升模型推理速度;将模型进行拆解,使用OpenMp并行计算,提升运算速度和模型的精确度;采用上采样技术保证输出图像分辨率不会降低,确保视频质量。

    一种基于复合多边形标志引导的无人机垂直降落方法

    公开(公告)号:CN109885086B

    公开(公告)日:2022-09-23

    申请号:CN201910179487.7

    申请日:2019-03-11

    Abstract: 本发明涉及无人机和机器视觉领域,具体是一种基于复合多边形标志引导的无人机垂直降落方法,包括以下步骤:(1)设置复合多边形标志;(2)无人机对拍摄的降落区域图像进行预处理;(3)无人机获取二值化边缘信息图像的轮廓信息;(4)无人机对二值化边缘信息图像的轮廓信息进行筛选;(5)无人机计算多边形轮廓的像素长度和中心点坐标;(6)无人机确定轮廓组合方式并识别复合多边形标志;(7)无人机计算其与标志物的相对坐标;(8)无人机降落控制;(9)无人机降落调整。本发明实现了无人机对特定目标的锁定、跟踪和精确的垂直降落等功能。

    基于位置与结构信息的图表示学习方法

    公开(公告)号:CN114265954A

    公开(公告)日:2022-04-01

    申请号:CN202111459096.4

    申请日:2021-12-02

    Abstract: 本发明公开了一种基于位置信息和结构信息的图表示学习方法:步骤1:获取输入图的信息,对每个节点构造一个近邻节点集;步骤2:根据每个节点的近邻节点集,构造拓扑空间的邻接矩阵,得到每个节点对应的基于结构信息的图节点特征表示;步骤3:将池化得分最高的k个节点作为位置参考点;步骤4:计算得到基于位置信息的图节点嵌入特征;步骤5:将基于结构信息的图节点嵌入特征和基于位置信息的图节点嵌入特征进行融合,得到最终的图节点特征表示。本发明的方法得到的基于位置信息和结构信息的节点嵌入包含了更充分的图特征,对下游任务起到了增益作用。该方法学习到了更加充分的节点信息,取得了良好的效果。

    基于自然语言描述的三维场景目标检测建模及检测方法

    公开(公告)号:CN113034592A

    公开(公告)日:2021-06-25

    申请号:CN202110251422.6

    申请日:2021-03-08

    Abstract: 本发明公开了一种基于自然语言描述的三维场景目标检测的建模及检测方法。方法包括:①设计语言先验图网络,用于将生成的名词短语及关系短语进行图表示;②构建点云场景中三维目标化外接候选框初始化预测网络;③基于语言先验图更新后的名词短语特征进行引导,对三维目标初始化候选框进行冗余裁剪及更新;④构建三维目标候选框视觉关系图网络;⑤基于更新后的名词短语特征和关系短语特征,分别与视觉关系图的节点和边进行相似性得分匹配,定位最终的三维目标。本发明通过构建语言先验图和视觉关系图,高效地捕获全局上下文依赖关系,同时还开发了交叉跨模态的图匹配策略,避免增加计算量的同时有效地提升大规模三维点云场景的目标定位精度。

    一种基于文本语义监督的视觉行为识别方法、系统及计算机可读介质

    公开(公告)号:CN112580362A

    公开(公告)日:2021-03-30

    申请号:CN202011508103.0

    申请日:2020-12-18

    Abstract: 本发明公开了一种基于文本语义监督的视觉行为识别方法、系统及计算机可读介质,方法包括文本语义特征提取、基于文本语义监督的视觉特征提取、构建视觉行为识别;本发明以相同类别行为视频样本集的文本描述句子为基础归纳各类行为的文本描述范式,构建样本对数据集,在文本语义提取模型中提取出文本描述句子的动作语义特征向量和关系语义特征向量,使用动作语义特征向量和关系语义特征向量对提取的动作视觉特征向量、关系视觉特征向量进行监督,利用提取到的动作视觉特征向量和关系视觉特征向量进行行为识别,以解决目前视觉行为识别领域内存在的视觉行为识别的准确率不高,文本语义监督的效率不高、且不能准确识别行为之间的动作和关系的问题。

Patent Agency Ranking