-
公开(公告)号:CN119835440A
公开(公告)日:2025-04-15
申请号:CN202411930385.1
申请日:2024-12-26
Applicant: 西安电子科技大学
IPC: H04N19/573 , H04N19/30 , H04N19/91 , H04N19/42 , H04N19/44 , G06N3/0464 , G06N3/082
Abstract: 本发明公开了一种基于嵌入式平台的视频压缩系统与方法,主要解决现有技术压缩效率低、适应性差以及计算量大导致应用受限的问题。方案包括:1)利用公开的视频数据构建样本集;2)由特征提取、运动估计、运动压缩/解压、运动补偿、残差压缩/解压以及特征重建模块构建视频压缩模型并训练;3)通过残差块剪枝对训练后的模型进行微调并做轻量化处理;4)将模型转换为部署平台支持的模型格式;5)将转换后的模型分解为压缩和解压模型,分别部署到两端的嵌入式平台中;6)采集视频并预处理后输入到编码端的压缩模型,得到二进制码流,传输至解码端的解压模型重建得到重构帧。本发明模型复杂度和计算复杂度低,能够在嵌入式设备上部署。
-
公开(公告)号:CN118245929A
公开(公告)日:2024-06-25
申请号:CN202410402596.1
申请日:2024-04-03
Applicant: 西安电子科技大学
IPC: G06F18/2431 , G06F18/214 , G06N3/0442 , G06N3/0464 , G06N3/049 , G06N3/0455 , G06N3/084 , G06N3/0895
Abstract: 本发明公开了一种基于潜在图案嵌入的自监督异构图节点分类方法,主要解决现有技术中异构图节点分类效果不佳的问题。包括:1)设计潜在重复图案嵌入模块,通过选择最相似的M个节点的k跳邻域构建子图序列;2)通过GCN网络捕获子图特征,构建子图特征序列;3)将子图特征序列作为Bi‑LSTM的输入,得到潜在重复图案表示;4)设计邻域结构嵌入NSE编码器从随机游走得到的序列中捕获节点的高阶邻域表示;5)通过随机策略生成负样本序列来构建对比学习损失;6)将获得的潜在重复图案表示、高阶邻域表示和节点自身特征融合得到最终的节点表示,并利用分类器实现分类。本发明能够更好地捕获信息,有效提升异构图节点分类准确率。
-
公开(公告)号:CN114265954B
公开(公告)日:2023-09-19
申请号:CN202111459096.4
申请日:2021-12-02
Applicant: 西安电子科技大学
IPC: G06F16/901 , G06N3/042 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明公开了一种基于位置信息和结构信息的图表示学习方法:步骤1:获取输入图的信息,对每个节点构造一个近邻节点集;步骤2:根据每个节点的近邻节点集,构造拓扑空间的邻接矩阵,得到每个节点对应的基于结构信息的图节点特征表示;步骤3:将池化得分最高的k个节点作为位置参考点;步骤4:计算得到基于位置信息的图节点嵌入特征;步骤5:将基于结构信息的图节点嵌入特征和基于位置信息的图节点嵌入特征进行融合,得到最终的图节点特征表示。本发明的方法得到的基于位置信息和结构信息的节点嵌入包含了更充分的图特征,对下游任务起到了增益作用。该方法学习到了更加充分的节点信息,取得了良好的效果。
-
公开(公告)号:CN116366783A
公开(公告)日:2023-06-30
申请号:CN202310157612.0
申请日:2023-02-23
Applicant: 西安电子科技大学广州研究院
IPC: H04N5/262 , G06N3/0464 , G06N3/08 , H04N5/268 , H04N19/436
Abstract: 本发明公开了一种视频图像处理的加速方法、系统、设备及存储介质,涉及图像处理技术领域。该方法包括:采集视频帧图像并对其进行格式转换;获取关键帧和参考帧;拆解网络模型为卷积层部分和后处理部分;对关键帧进行降采样处理,获取降采样图像;将降采样图像送入卷积层部分进行推理,获取预测参数图;对预测参数图进行上采样处理,获取上采样图像并将其与视频帧图像进行像素矩阵运算,获取运算结果图。本发明采用帧差法技术保证了视频图像处理的实时性;采用NEON技术和降采样技术提升模型推理速度;将模型进行拆解,使用OpenMp并行计算,提升运算速度和模型的精确度;采用上采样技术保证输出图像分辨率不会降低,确保视频质量。
-
公开(公告)号:CN112667078B
公开(公告)日:2023-06-09
申请号:CN202011553957.0
申请日:2020-12-24
Applicant: 西安电子科技大学
IPC: G06F3/01 , G06F3/038 , G06F3/0354 , G06T7/73 , G06T3/00 , G06V40/16 , G06V10/764 , G06V10/82 , G06V40/18 , G06N3/045 , G06N3/08
Abstract: 本发明公开了基于视线估计的多屏场景下鼠标快速控制方法、系统及计算机可读介质,方法包括图像采集、图像处理、读取坐标位置、控制鼠标动作的步骤;其中图像处理包括人脸检测、面部特征点定位、头部姿态估计、三维视线估计、坐标转化、设置置信度阈值的步骤。本发明基于视线估计的多屏场景下鼠标快速控制方法、系统及计算机可读介质,可以有效解决在大屏或跨多屏浏览信息时的鼠标跟随问题,尤其是在多个大屏幕扩展的工作场景下使人机交互更为便捷,控制鼠标在多屏间大范围快速移动,然后人手可以控制鼠标做小范围的精细控制,通过手眼配合,达到在多屏间对鼠标快速、自然、高效地控制。
-
公开(公告)号:CN115480582A
公开(公告)日:2022-12-16
申请号:CN202210986452.6
申请日:2022-08-17
Applicant: 西安电子科技大学 , 中国船舶集团有限公司综合技术经济研究院
Abstract: 本发明公开了一种基于LSTM的目标的机动预测方法、电子设备和存储介质,包括以下步骤;步骤1:构建无人机对战过程目标机机动选择数据集;步骤2:提取目标机动对抗过程空间态势特征;步骤3:对数据集进行分割和预处理;步骤4:建立基于LSTM的目标的机动预测网络模型;步骤5:利用训练集对基于LSTM的目标的机动预测网络模型进行训练,并利用测试集进行准确率检测。本发明不论是对单个机动控制参数的预测,还是对所有机动控制参数同时预测正确问题都能得了良好的效果。
-
公开(公告)号:CN109885086B
公开(公告)日:2022-09-23
申请号:CN201910179487.7
申请日:2019-03-11
Applicant: 西安电子科技大学
Abstract: 本发明涉及无人机和机器视觉领域,具体是一种基于复合多边形标志引导的无人机垂直降落方法,包括以下步骤:(1)设置复合多边形标志;(2)无人机对拍摄的降落区域图像进行预处理;(3)无人机获取二值化边缘信息图像的轮廓信息;(4)无人机对二值化边缘信息图像的轮廓信息进行筛选;(5)无人机计算多边形轮廓的像素长度和中心点坐标;(6)无人机确定轮廓组合方式并识别复合多边形标志;(7)无人机计算其与标志物的相对坐标;(8)无人机降落控制;(9)无人机降落调整。本发明实现了无人机对特定目标的锁定、跟踪和精确的垂直降落等功能。
-
公开(公告)号:CN114265954A
公开(公告)日:2022-04-01
申请号:CN202111459096.4
申请日:2021-12-02
Applicant: 西安电子科技大学
IPC: G06F16/901 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于位置信息和结构信息的图表示学习方法:步骤1:获取输入图的信息,对每个节点构造一个近邻节点集;步骤2:根据每个节点的近邻节点集,构造拓扑空间的邻接矩阵,得到每个节点对应的基于结构信息的图节点特征表示;步骤3:将池化得分最高的k个节点作为位置参考点;步骤4:计算得到基于位置信息的图节点嵌入特征;步骤5:将基于结构信息的图节点嵌入特征和基于位置信息的图节点嵌入特征进行融合,得到最终的图节点特征表示。本发明的方法得到的基于位置信息和结构信息的节点嵌入包含了更充分的图特征,对下游任务起到了增益作用。该方法学习到了更加充分的节点信息,取得了良好的效果。
-
公开(公告)号:CN113034592A
公开(公告)日:2021-06-25
申请号:CN202110251422.6
申请日:2021-03-08
Applicant: 西安电子科技大学
IPC: G06T7/73 , G06K9/62 , G06F40/289
Abstract: 本发明公开了一种基于自然语言描述的三维场景目标检测的建模及检测方法。方法包括:①设计语言先验图网络,用于将生成的名词短语及关系短语进行图表示;②构建点云场景中三维目标化外接候选框初始化预测网络;③基于语言先验图更新后的名词短语特征进行引导,对三维目标初始化候选框进行冗余裁剪及更新;④构建三维目标候选框视觉关系图网络;⑤基于更新后的名词短语特征和关系短语特征,分别与视觉关系图的节点和边进行相似性得分匹配,定位最终的三维目标。本发明通过构建语言先验图和视觉关系图,高效地捕获全局上下文依赖关系,同时还开发了交叉跨模态的图匹配策略,避免增加计算量的同时有效地提升大规模三维点云场景的目标定位精度。
-
公开(公告)号:CN112580362A
公开(公告)日:2021-03-30
申请号:CN202011508103.0
申请日:2020-12-18
Applicant: 西安电子科技大学
IPC: G06F40/30 , G06F40/205 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于文本语义监督的视觉行为识别方法、系统及计算机可读介质,方法包括文本语义特征提取、基于文本语义监督的视觉特征提取、构建视觉行为识别;本发明以相同类别行为视频样本集的文本描述句子为基础归纳各类行为的文本描述范式,构建样本对数据集,在文本语义提取模型中提取出文本描述句子的动作语义特征向量和关系语义特征向量,使用动作语义特征向量和关系语义特征向量对提取的动作视觉特征向量、关系视觉特征向量进行监督,利用提取到的动作视觉特征向量和关系视觉特征向量进行行为识别,以解决目前视觉行为识别领域内存在的视觉行为识别的准确率不高,文本语义监督的效率不高、且不能准确识别行为之间的动作和关系的问题。
-
-
-
-
-
-
-
-
-