一种面向视频的非均匀风格迁移方法

    公开(公告)号:CN110706151B

    公开(公告)日:2023-08-08

    申请号:CN201910859285.7

    申请日:2019-09-11

    Applicant: 南京大学

    Abstract: 一种面向视频的非均匀风格迁移方法,首先对于输入的视频,为每个视频帧上所有像素设定相应的风格化程度,将视频帧表示为一层或多层特征图,同时采用相同的方法将风格图像表示为一层或多层特征图,计算风格迁移中的内容损失、风格损失和时间一致性损失,求和得到总损失函数,最小化风格迁移总损失函数,生成风格迁移结果。供本发明方法解决了视频风格迁移中过度风格化或风格化不足的问题,实现了在突出部分区域内容的同时强烈渲染其它区域的风格,在风格化的过程中更好的平衡风格化视频的内容保持程度和风格渲染程度。

    基于单目视频的多阶段人体动作捕捉方法、设备及介质

    公开(公告)号:CN116386141A

    公开(公告)日:2023-07-04

    申请号:CN202310329938.7

    申请日:2023-03-30

    Applicant: 南京大学

    Abstract: 基于单目视频的多阶段人体动作捕捉方法、设备及介质,对于固定相机情境下拍摄的单目RGB视频,将人体动作捕捉分为多个阶段:第一阶段使用人体姿态检测器对输入的单目视频逐帧估计二维的人体关节点;第二阶段利用深度学习来获取视频序列中的空间与时序信息,学习从二维的人体关节点到相机空间中的三维人体关节点的映射关系,并感知人体在三维空间中的运动轨迹和触地情况;第三阶段引入反向运动学思想,通过制定合理的惩罚策略,将三维的人体网格模型拟合到三维骨骼上,以更真实地刻画运动序列。本发明显著地提升重建出的人体模型与输入的RGB图像的对齐程度,并且更加真实地估计双脚与地面的接触情况,视觉上有明显的提升。

    基于知识蒸馏的渐进式跟踪模型压缩方法、设备及介质

    公开(公告)号:CN116343006A

    公开(公告)日:2023-06-27

    申请号:CN202310269544.7

    申请日:2023-03-20

    Applicant: 南京大学

    Abstract: 基于知识蒸馏的渐进式跟踪模型压缩方法、设备及介质,通过知识蒸馏方式,以教师模型‑助教模型‑学生模型多级蒸馏,并在蒸馏中通过动态的衰退系数来逐渐削弱直至撤除需要撤去的层,实现渐进式压缩单流跟踪模型,得到轻量化的跟踪器FOST,所述单流跟踪模型基于Transformer,对于输入的模板和搜索图片同时进行特征提取和信息融合。本发明通过渐进式的撤去层数和助教网络,克服了Transformer模型深度压缩过程中的特征不匹配和不连续问题,有效地传递教师模型信息,本发明提出的跟踪器也因此能够同时须有高精度和高速度,并首次使单流跟踪器能够在CPU上部署。

    一种以人为主体的视觉关系分割方法

    公开(公告)号:CN110889397B

    公开(公告)日:2023-06-20

    申请号:CN201911284548.2

    申请日:2019-12-13

    Applicant: 南京大学

    Abstract: 一种以人为主体的视觉关系分割方法,首先对于输入的图像,提取物体实例分割并分开一般物体和人体,同时对于输入的图像,提取人脸检测结果;然后将从物体实例分割中提取的人体分割和人脸检测结果结合得到更完善的检测分割结果并将物体分割和改善后的人体分割分别作为宾语和主语的图像分割输入预测网络,得到图像中以人为主语的 视觉关系三元组并根据语言先验统计对结果进行筛选。本发明生成的分割定位结果和关系三元组具有较好的准确度,可以为图像搜索、图像说明、图像问答提供支持。

    一种基于点云数据的自监督学习场景流方法

    公开(公告)号:CN115392449A

    公开(公告)日:2022-11-25

    申请号:CN202110566905.5

    申请日:2021-05-24

    Applicant: 南京大学

    Abstract: 一种基于点云数据的自监督学习场景流方法,利用点云数据本身的特性来构建数据项约束与平滑项约束,用这两种约束来评估两帧点云的相似性,并以此误差来训练一个的自监督网络,用于得到场景流。本发明利用点云数据内部的约束来评估运动后的第二帧点云与预测的第二帧点云的相似性,从而预测出场景流,相比现在的方法,或利用有标签的点云数据进行有监督的学习,或通过具有深度信息的2.5D或3D图像数据把2D光流转换到3D中来解决这个问题,本发明直接消费点云数据并用自监督的深度学习方法学习场景流。本发明方法很好的考虑了点云数据本身的特性,对此建立起数据项约束;除此之外本发明也考虑了场景级点云数据局部的刚体性,建立了平滑项约束。

    一种基于自监督的RGB-D特征学习方法

    公开(公告)号:CN115239970A

    公开(公告)日:2022-10-25

    申请号:CN202110435066.3

    申请日:2021-04-22

    Applicant: 南京大学

    Abstract: 一种基于自监督的RGB‑D特征学习方法,包括以下步骤:1)处理训练样例阶段;2)网络配置阶段;3)训练阶段;4)测试阶段。本发明设计的自监督设计框架将Depth和RGB进行有效结合,通过对比学习和生成学习迫使自监督模型学习模态之间的共享信息,从而获得有效的特征表示,更好的服务下游任务。相比现在的方法使用RGB预训练模型初始化Depth分支模型存在模态差异,以及使用像素级约束存在样本分布不均匀等问题。本发明通过自监督学习以及对比学习等方式有效地融合Depth和RGB信息,并避免了这类问题。

    一种面向长尾目标检测的分类对数归一化方法

    公开(公告)号:CN114863088A

    公开(公告)日:2022-08-05

    申请号:CN202210319585.8

    申请日:2022-03-29

    Applicant: 南京大学

    Abstract: 一种面向长尾目标检测的分类对数归一化方法,目标检测中,对分类器的预测分布使用归一化的方式执行矫正,具体为利用分类器已有的分类输出的分类对数计算统计量,来归一化分类网络最终激活值,自我纠正有偏差的预测结果。尤其适用于长尾目标检测。本发明方法是免训练和免调参的,与具体目标检测模型和分布无关,是即插即用的。本发明方法同时在长尾目标检测和分类任务上展现了有效性和通用性,在现有的极具挑战性的长尾目标检测数据集LVIS 1.0上,本发明方法在多种检测器设置下,所有标准指标均超过了现有最好模型。本发明方法也在长尾分类数据集ImageNet‑LT上取得了较好的效果。

    一种基于无锚框技术的时序动作检测方法及检测器

    公开(公告)号:CN114821774A

    公开(公告)日:2022-07-29

    申请号:CN202210404413.0

    申请日:2022-04-18

    Applicant: 南京大学

    Abstract: 一种基于无锚框技术的时序动作检测方法及检测器,构建网络检测视频中的时序动作,包括特征提取网络、时序特征金字塔、边界偏移回归器、实例感知对齐模块和细化分类回归器,特征提取网络提取视频的时空特征,时序特征金字塔获得不同时间分辨率的特征,边界偏移回归器对每一个时序位置预测该时刻相对动作左右边界的距离,再经过变换得到动作起止时间,实例感知对齐模块根据动作起止时间获取用于精细预测的动作特征,细化分类回归器用于预测动作类别和微调动作边界,得到时序动作检测结果。本发明直接回归距离动作左右边界的距离,完成视频中动作的时序定位和分类任务,相比于现有带锚框的检测器,无需预先设置锚框,更加简单高效。

    一种基于毫米波雷达与视觉信号的道路障碍物检测方法

    公开(公告)号:CN114818819A

    公开(公告)日:2022-07-29

    申请号:CN202210493558.2

    申请日:2022-05-07

    Applicant: 南京大学

    Abstract: 一种基于毫米波雷达与视觉信号的道路障碍物检测方法,通过毫米波雷达及视觉传感器检测道路前方障碍物,通过融合毫米波雷达与视觉图像两种信号,检测目标物体类别,首先将毫米波雷达信号预处理,将毫米波雷达报文转化为目标点位置的形式,并与视觉图像信号进行时间同步;将毫米波雷达目标点根据坐标匹配关系映射于视觉图像信号之上,实现两种模态的融合;对映射到视觉图像信号上的毫米波雷达信息进行目标检测,最后对检测结果进行尺度估计,细化障碍物信息。本发明实现了多模态细粒度障碍物检测,相比传统单模态方法具有精确度与运行效率上的优势,具备高度实用价值。

Patent Agency Ranking