一种基于骨架姿态的人物跟踪方法

    公开(公告)号:CN111738096B

    公开(公告)日:2022-08-19

    申请号:CN202010471069.8

    申请日:2020-05-28

    Applicant: 复旦大学

    Inventor: 吴渊 金城 张志远

    Abstract: 本发明公开了一种基于骨架姿态的人物跟踪方法。本发明分为离线训练阶段、在线姿态识别阶段和在线跟踪阶段。离线训练阶段,先准备模型训练集,将OpenPose格式的骨架关键点坐标经过归一化后作为模型输入,再对模型进行训练。在线姿态识别阶段,将含有待跟踪人物的图像输入模型,提取出图像中所有人物的骨架。在线跟踪阶段,先将图像中的人物骨架依次输入训练好的模型得到骨架姿态特征,再求出图像中每个人物骨架姿态特征与在库特征之间的欧式距离矩阵,用匈牙利算法求出每个人物特征匹配的id作为跟踪结果,最后更新在库id。本发明能够基于骨架姿态进行人物跟踪,扩展了人物跟踪的方法,在智能视频监控领域有广阔的应用可能。

    基于Transformer的多视角3D姿态估计系统

    公开(公告)号:CN114821099A

    公开(公告)日:2022-07-29

    申请号:CN202210370621.3

    申请日:2022-04-10

    Abstract: 本发明属于计算机视觉领域,具体涉及一种基于Transformer的多视角3D姿态估计系统。该系统按照处理流程先后顺序分为单视角时空Transformer特征提取模块和多视角Transformer特征交换模块两个部分。单视角时空Transformer特征提取模块对输入的多视角姿态序列提取不同视角的时空域特征信息;多视角Transformer特征交换模块,将不同视角的时空域特征信息两两交换,然后经过回归头输出最终的3D姿态估计结果。本发明能充分利用姿态序列间的时间上下文和空间关系,在不同视角间充分进行特征交换和传输,提高了3D姿态估计结果的准确度。

    一种基于对抗学习的植物叶片图像细分类方法

    公开(公告)号:CN113159171B

    公开(公告)日:2022-07-22

    申请号:CN202110423483.6

    申请日:2021-04-20

    Applicant: 复旦大学

    Inventor: 金城 靳璐瑞 吴渊

    Abstract: 本发明属于图像分类技术领域,具体为一种基于对抗学习的植物叶片图像细分类方法。本发明通过将植物叶片图像多次分割打乱之后作为样本训练植物叶片图像细分类模型;最后将植物叶片图像经过同样的多重打乱操作之后输入到训练好的网络模型,计算并输出植物图片的细分类结果。相比于现有的植物细分类方法,本发明所提出的方法可以提取图片的多个粒度的特征,另外引入的全局上下文块可以融合图像的全局和局部特征,提高了网络融合多个粒度的特征的能力。

    一种基于渐进校准式网络的实时多姿态人脸检测算法

    公开(公告)号:CN111739070B

    公开(公告)日:2022-07-22

    申请号:CN202010471082.3

    申请日:2020-05-28

    Applicant: 复旦大学

    Inventor: 吴渊 金城 李雨晴

    Abstract: 本发明属于人脸检测技术领域,具体为一种基于渐进校准式网络的实时多姿态人脸检测算法。本发明针对人脸检测时旋转和有遮挡的问题,将人脸的旋转问题分为三个阶段去解决,每一个阶段都将人脸进行一定范围的角度校准,在最后一个阶段再对校准后的人脸图像进行最终的检测和精确角度判定。本发明在CASIA‑WebFace数据集的基础上,通过遮挡物标注、人脸关键点定位、遮挡人脸合成、图像旋转等数据增强一系列过程,构造了一个旋转、有遮挡的SORF人脸数据集用于网络模型的训练及测试。本发明能够在保证检测实时性的基础上,有效地检测旋转、有遮挡的人脸,在常见的公开数据集上也取得了优异的效果。

    一种基于图注意力时空卷积的3D姿态估计方法

    公开(公告)号:CN113538581A

    公开(公告)日:2021-10-22

    申请号:CN202110811915.0

    申请日:2021-07-19

    Abstract: 本发明属于计算机视觉技术领域,具体为一种基于图注意力时空卷积的3D姿态估计方法。该3D姿态估计方法基于按照处理流程先后顺序分为前处理模块、切割图注意力时空卷积模块、补全图注意力时空卷积模块、后处理模块4部分的系统完成。前处理模块初步提取时域信息,然后通过切割图注意力时空卷积模块、补全图注意力时空卷积模块进一步提取时空域信息。本发明能充分利用人体骨架在空间上的约束信息抽取骨架序列空域信息,同时能建立骨架序列时域上的长时依赖,提高了3D姿态估计的精确度。并且不需要原始视频帧的信息,减少计算量。本发明所提框架在3D姿态估计任务上的表现优于现有方法。

    一种面向中文分词的搜索算法

    公开(公告)号:CN108846016B

    公开(公告)日:2021-08-20

    申请号:CN201810422499.3

    申请日:2018-05-05

    Applicant: 复旦大学

    Abstract: 本发明属于文本搜索引擎技术领域,具体为一种面向中文分词的搜索算法。本发明算法主要分为两个阶段:离线构建索引阶段和在线查找阶段。在离线构建索引阶段,首先提取所有原始字符串集合的后缀串集合,然后由后缀串集合生成改进的后缀树;在在线查找阶段,首先根据基于后缀树的索引模型得到关键词的查询结果,然后量化关键词和查询结果的匹配程度,最后将查询结果按匹配程序由高到低排序后返回。本发明通过一种改进的基于后缀树的索引结构来平衡索引构建时间和占用空间,使用本发明的索引结构的搜索效率远高于对结果集暴力计算匹配度并排序的效率。

    一种基于深度学习的视频近似拷贝检索算法

    公开(公告)号:CN108763295B

    公开(公告)日:2021-04-30

    申请号:CN201810347069.X

    申请日:2018-04-18

    Applicant: 复旦大学

    Abstract: 本发明属于图像与视频处理技术领域,具体为一种基于深度学习的视频近似拷贝检索算法。本发明算法分为两个阶段:离线构建索引阶段和在线检索阶段。在离线构建索引阶段,使用深度卷积神经网络提取采样帧的特征值,然后采用k‑d树为视频库内的所有视频采样帧集建立索引;在在线检索阶段,采用同样的方法提取查询视频的采样帧的特征值,并用近似最近邻搜索的方法在索引库中找出与其相似的候选视频,最后计算出所有候选视频与查询视频的相似度,并将相似度由高到低排序后给出近似拷贝检索的结果。本发明可大幅加速整个检索过程,同时可得到候选视频与查询视频的相似可能性以供后续步骤使用,进一步提高了检索速度。

Patent Agency Ranking