一种基于视频的单阶段多人二维人体姿态估计方法及装置

    公开(公告)号:CN119091470B

    公开(公告)日:2025-03-25

    申请号:CN202411570528.2

    申请日:2024-11-06

    Abstract: 本发明公开了一种基于视频的单阶段多人二维人体姿态估计方法及装置,属于多人二维人体姿态估计领域,通过引入时序信息融合技术对视频序列中的多人人体姿态进行高效建模。首先,本发明对单个视频序列中的多人人体信息进行全面建模,构建了跨帧人体时序信息融合模块,能够有效捕捉和增强目标帧中人体的全局信息,使得在复杂场景下仍能准确识别和定位多个人体。其次,该方法深入建模人体各个关节点的信息,并设计了跨帧关节点时序信息融合模块,专门用于强化同一人在不同帧中相同关节点的信息传递与关联性。这种设计能够显著改善在视频序列中由于运动模糊、遮挡以及对焦不准等原因导致的关节点识别困难,从而使目标帧的关节点预测更加精确和稳定。

    一种剧场环境下基于近红外防伪油墨的演员身份重识别方法

    公开(公告)号:CN113920164B

    公开(公告)日:2024-05-24

    申请号:CN202111252678.5

    申请日:2021-10-27

    Abstract: 本发明公开了一种剧场环境下基于近红外防伪油墨的演员身份重识别方法。该方法通过近红外相机获取彩色相机中不可见的近红外防伪油墨标记,然后将图像送入训练好的检测器与分类器中,最终实现对舞台上表观相似演员跟踪时的身份重识别。本方法用仅近红外相机可见的近红外防伪油墨标记替代已有的演员表观信息或传感器作为区分演员身份的关键特征,具有以下优势:极大程度减少了舞台复杂光照对演员跟踪过程中身份识别稳定性的干扰,以及通过引入特有近红外防伪油墨标记信息解决了演员表观相似所带来的跟踪困难问题。与基于传感器的身份识别方法相比,该方法成本低,操作性强,在舞台演出中具有普遍的适用性。

    位置社交网络中的基于高覆盖性社区发现的朋友推荐方法及装置

    公开(公告)号:CN114637912B

    公开(公告)日:2024-05-03

    申请号:CN202210220021.9

    申请日:2022-03-08

    Abstract: 本发明公开了一种位置社交网络中的基于高覆盖性社区发现的朋友推荐方法及装置。其实现步骤为:获取包含查询用户的连通k‑桁架;基于连通k‑桁架求出满足条件的所有地理区域圆集合;计算出每个地理区域圆内的包含查询用户的连通k‑桁架;根据当前结果中的社区数量直接将连通k‑桁架加入结果集合或者用连通k‑桁架替换最小独特集合;返回最终结果集合作为针对查询用户的朋友推荐社区。本发明旨在找到给定数量具有高覆盖性的朋友推荐社区,使得所求社区所包含的总用户个数最多,并且包含查询用户。因此,在位置社交网络中的基于高覆盖性社区发现的朋友推荐方法及装置对于个性化推荐具有极大的效益。

    一种无向图信号的多尺度分解方法
    114.
    发明公开

    公开(公告)号:CN117633471A

    公开(公告)日:2024-03-01

    申请号:CN202311662701.7

    申请日:2023-12-06

    Abstract: 本发明公开了一种无向图信号的多尺度分解方法,属于信息处理领域。本发明对任意的图信号提出基于游走邻接矩阵的动态多尺度图信号分解方法,采用基于游走邻接矩阵的动态游走情况进行邻接点的动态连接的方式,可以实现当下的图极值点的动态定义,为图信号多尺度分解提供动态的尺度限制,可以实现任意图信号的多尺度分解,为图信号多尺度处理提供了必要基础,实现了图信号动态可控多尺度分解,为图信号灵活分解及其应用提供技术依据。

    基于双分支动态蒸馏学习的跨模态视频检索方法及装置

    公开(公告)号:CN116226452A

    公开(公告)日:2023-06-06

    申请号:CN202310226304.9

    申请日:2023-03-03

    Abstract: 本发明公开了一种基于双分支动态蒸馏学习的跨模态视频检索方法及装置,从一个新的角度来处理跨模态视频检索,即从大规模视觉语言预训练模型中提取泛化知识,并将其转移到任务特定网络。该方法是一个具有动态知识蒸馏的双重学习框架,利用大规模视觉语言模型的知识作为教师来指导学生模型。在知识蒸馏过程中,设计了一个继承分支来吸收教师模型中的知识,同时为了避免大规模预训练模型由于领域差距而导致的性能差异,设计了一个探索分支来探索下游任务的特定属性。本发明提出的网络模型利用双分支结构,能够深度建模文本和对应视频间的相关关系,从而有效解决文本到视频的检索任务。

    一种密文图像上的安全卷积神经网络推理方法及系统

    公开(公告)号:CN115345307B

    公开(公告)日:2023-02-14

    申请号:CN202211263823.4

    申请日:2022-10-17

    Abstract: 本发明公开了一种密文图像上的安全卷积神经网络推理方法及系统,设计了一种拆分方法,对输入图像进行拆分;基于卷积神经网络的计算特定,将推理计算分发给三个服务器执行,其中两个为主计算节点,一个为ReLU辅助计算节点;计算协议保证了两个主计算节点的计算结果相加即为真实的卷积神经网络推理结果。与现有技术相比,本发明无需任何加密手段,时间开销较小。对于用户来说,仅需对输入图像进行拆分和合并等简单操作,相比加解密操作更方便高效。避免了服务器端的预计算,这也减小了总开销。本发明提出的推理方法无需使用任何加密原语,因此推理计算用时更短;且对用户无加密计算能力的要求。与现有技术相比,本发明实用性更强。

    一种多模态融合的小样本舞蹈动作识别方法及装置

    公开(公告)号:CN115661561A

    公开(公告)日:2023-01-31

    申请号:CN202210767390.X

    申请日:2022-06-30

    Abstract: 本发明公开了一种多模态融合的小样本舞蹈动作识别方法及装置,提出使用基于视频预览指导的多模态数据融合的方法,将多模态数据的特征学习方式应用至小样本舞蹈动作识别任务中,并通过不同模态数据交汇融合的方式,缓解了小样本领域因数据量过少而导致的识别困难问题。相较于传统小样本动作识别方法,本方法利用多模态信息,有效解决了rgb单模态数据在视频动作识别时性能不够鲁棒的问题;此外,使用的视频预览指导多模态数据融合的方法,加强了模型在各模态空间中的语义提取能力。相较于传统小样本动作识别方法,本发明所提出的方法识别性能更强,利用视频信息特征更充分,更适应于小样本舞蹈动作识别任务。

    基于特征对比的菜品识别方法
    120.
    发明公开

    公开(公告)号:CN115187972A

    公开(公告)日:2022-10-14

    申请号:CN202210223171.5

    申请日:2022-03-07

    Abstract: 本发明公开了一种基于特征对比的菜品识别方法,包含以下步骤:通过摄像头采集待识别的图片;通过深度学习算法检测图片中的托盘、饮料和餐盘;根据菜品的坐标进行逻辑判断,过滤干扰区域获得待识别区域;判断待识别区域是否为静止状态;在待识别区域为静止状态时使用深度学习算法识别待识别区域获得对应菜品名称;根据菜品名称从数据库中匹配出菜品对应的菜品信息。本发明所提供的基于特征对比的菜品识别方法,提高了菜品的识别效率和识别精度,极大的改善了餐厅的智能化程度。

Patent Agency Ranking