一种基于语义增强和多尺度特征融合的人体姿态估计方法

    公开(公告)号:CN119763189A

    公开(公告)日:2025-04-04

    申请号:CN202411829878.6

    申请日:2024-12-12

    Abstract: 本发明公开了一种基于语义增强和多尺度特征融合的人体姿态估计方法。所述方法包括以下步骤:在MobileNetV2网络的基础上构建特征金字塔,统一不同尺度特征的分辨率并拼接;将拼接之后的特征输入到基于EfficientVit的尺度感知语义模块,生成尺度感知的全局语义表示;构建深层语义注入模块,将尺度感知的全局语义与对应的特征进行融合,采用上下文指导的注意力机制选择性强化相关特征;自适应多尺度特征融合,网络能够自适应地调整感受野大小,以更好地捕捉不同尺度的人体关键点特征,同时提高深浅层特征的利用率;使用1×1卷积层构建关键点检测头得到最终的关键点热图输出。本发明的模型能更好地感知人体姿态的语义特征和多尺度视觉线索,从而显著提升模型的泛化能力。

    一种V2X网络性能测试及综合评价分析方法

    公开(公告)号:CN108430069B

    公开(公告)日:2021-05-18

    申请号:CN201810140166.1

    申请日:2018-02-11

    Abstract: 本发明请求保护一种V2X网络性能测试评价分析方法,涉及车联网网络性能测试分析领域。其包括:搭建LTE网络性能测试和DSRC网络性能测试平台;进行LTE和DSRC在车联网环境下的网络性能,确定网络性能指标并计算网络性能指标值;结合熵权法和层次分析法确定各网络性能指标的权重。计算各项性能指标的功效分数,通过与各项性能指标的权重的加权计算得到综合性能评价分数,得到定量分析结果;使用模糊综合分析法结合综合权重得到定性分析结果;结合定量分析结果和定性分析结果得到综合分析评价结果。本发明通过实际测试车联网环境下的网络性能参数,综合考虑车联网各项性能指标对网络性能的影响,从而更加准确的评价车联网网络性能。

    一种V2X网络性能测试及综合评价分析方法

    公开(公告)号:CN108430069A

    公开(公告)日:2018-08-21

    申请号:CN201810140166.1

    申请日:2018-02-11

    Abstract: 本发明请求保护一种V2X网络性能测试评价分析方法,涉及车联网网络性能测试分析领域。其包括:搭建LTE网络性能测试和DSRC网络性能测试平台;进行LTE和DSRC在车联网环境下的网络性能,确定网络性能指标并计算网络性能指标值;结合熵权法和层次分析法确定各网络性能指标的权重。计算各项性能指标的功效分数,通过与各项性能指标的权重的加权计算得到综合性能评价分数,得到定量分析结果;使用模糊综合分析法结合综合权重得到定性分析结果;结合定量分析结果和定性分析结果得到综合分析评价结果。本发明通过实际测试车联网环境下的网络性能参数,综合考虑车联网各项性能指标对网络性能的影响,从而更加准确的评价车联网网络性能。

    基于可分离三维残差注意网络的人体动作识别方法

    公开(公告)号:CN113065450B

    公开(公告)日:2022-09-20

    申请号:CN202110334547.5

    申请日:2021-03-29

    Abstract: 本发明涉及一种基于可分离三维残差注意网络的人体动作识别方法,属于计算机视觉领域。该方法包括:S1:利用可分离三维卷积替换3D ResNet中的标准三维卷积,搭建Sep‑3D ResNet;S2:设计通道注意力模块和空间注意力模块,然后按顺序堆叠构造双重注意力机制;S3:对不同时刻的中层卷积特征进行双重注意力加权,在时间维度上扩展双重注意力模块,然后将其嵌入到Sep‑3D ResNet的Sep‑3D RAB中,搭建Sep‑3D RAN;S4:利用多阶段训练策略对Sep‑3D RAN进行联合端到端训练。本发明能提升分类判别特征的区分能力,实现了高质量时空视觉特征的高效提取,能够增强模型的分类精度和识别效率。

    基于混合卷积的多级特征融合模型的视频动作识别方法及系统

    公开(公告)号:CN113128395A

    公开(公告)日:2021-07-16

    申请号:CN202110413461.1

    申请日:2021-04-16

    Abstract: 本发明涉及一种基于混合卷积的多级特征融合模型的视频动作识别方法及系统,属于计算机视觉技术领域,采用二维卷积和可分离三维卷积构造混合卷积模块;沿着时间维度对各输入特征执行通道移位操作,构建时间移位模块,促进相邻帧之间的信息流动,补偿二维卷积操作对动态特征进行捕捉的缺陷;从骨干网络的不同卷积层中导出多级互补特征,并对其进行空间调制与时间调制,从而使各层次特征在空间维度上具有一致的语义信息,在时间维度上具有多变的视觉节奏线索;通过构造自下而上的特征流和自顶向下的特征流,使各个特征之间相辅相成,互为补充,并对所述特征流进行并行处理,以实现多级特征融合;利用两阶段训练策略进行模型训练。

    基于CNN-LSTM和attention的视频动作识别方法

    公开(公告)号:CN111310676A

    公开(公告)日:2020-06-19

    申请号:CN202010107297.7

    申请日:2020-02-21

    Abstract: 本发明涉及一种基于CNN-LSTM和attention的视频动作分类方法,属于计算机视觉领域,包括以下步骤:S1:从预训练过的卷积神经网络CNN中导出多层深度特征来表示视频动作,利用Conv-LSTM和FC-LSTM捕获不同视频帧之间的上下文关系信息,对视频动作进行时序建模;S2:通过TAM和JSTAM,加强动作表征中的时间显著性和时空显著性;S3:采用两种注意力模型得到包含关键信息的视频动作全局表征,利用PCA降维算法对高维的动作表征向量进行降维以及去相关;S4:给时间注意力网络TAN和联合时间注意力网络JSTAN两个独立网络的输出分配不同的权值,将多个表征向量整合为最终的分类向量。

    一种异构小蜂窝网络中的D2D模式选择方法

    公开(公告)号:CN104486744B

    公开(公告)日:2018-03-13

    申请号:CN201410833648.7

    申请日:2014-12-29

    Inventor: 张家波 田智

    CPC classification number: Y02D70/20

    Abstract: 本发明公开了一种异构小蜂窝网络中的D2D模式选择方法,根据D2D链路不同的工作模式,将其划分为不同的模式组;其次根据不同的模式组选择对应的联合决策状态空间;再根据所选择的联合决策状态空间,模式组之间执行联合决策算法,并决定是否需要进行组内D2D链路的调整;然后根据联合决策算法的结果,动态地调整模式组内部的D2D链路,并根据调整结果更新状态空间。最后根据状态空间的更新结果,判断是否达到稳定状态,若是未达到稳定状态,则继续执行联合决策算法,若是达到稳定状态,则表明所有D2D链路传输代价的总和最小。本发明在确保通信质量的前提下,能够有效地减小总的传输功率和信道开销。

Patent Agency Ranking