-
公开(公告)号:CN110706151A
公开(公告)日:2020-01-17
申请号:CN201910859285.7
申请日:2019-09-11
Applicant: 南京大学
Abstract: 一种面向视频的非均匀风格迁移方法,首先对于输入的视频,为每个视频帧上所有像素设定相应的风格化程度,将视频帧表示为一层或多层特征图,同时采用相同的方法将风格图像表示为一层或多层特征图,计算风格迁移中的内容损失、风格损失和时间一致性损失,求和得到总损失函数,最小化风格迁移总损失函数,生成风格迁移结果。供本发明方法解决了视频风格迁移中过度风格化或风格化不足的问题,实现了在突出部分区域内容的同时强烈渲染其它区域的风格,在风格化的过程中更好的平衡风格化视频的内容保持程度和风格渲染程度。
-
公开(公告)号:CN106846400A
公开(公告)日:2017-06-13
申请号:CN201510888926.3
申请日:2015-12-04
Applicant: 南京大学
IPC: G06T7/70
Abstract: 一种结合窗口评分与超像素组合的物体位置预估方法,在RGB‑D图像上先使用窗口评分初始化物体边界框,再在超像素表示的基础上确定物体边界框调整的弹性范围,最后综合利用颜色特征与深度特征,采用超像素组合方法对物体边界框进行调整,最终获得物体位置预估结果。本发明综合了两种主流的物体位置预估方法,综合利用了RGB‑D图像的颜色通道与深度通道,能够面对RGB‑D中物体位置预估的任务,取得比现有方法更好的物体位置预估效果。
-
公开(公告)号:CN103902982B
公开(公告)日:2017-02-15
申请号:CN201410141636.8
申请日:2014-04-09
Applicant: 南京大学
Abstract: 本发明公开了一种基于软分配BoF的目标跟踪方法。本发明通过将各个patch的每一种局部特征分配到对应codebook中的多个codeword,并计算其权重得到跟踪目标和候选目标的BoF表示。然后通过BoF表示的相似度比较,选择与跟踪目标最相似的候选目标。区别于现有目标跟踪方法,本发明采用了软分配策略,提高了BoF表示的健壮性和区分度,提升了跟踪方法的精确度,减少了跟踪失败的场景,从而获得更佳的跟踪结果;其次本发明在构建codebook时,不仅在跟踪目标范围区进行patch采样,还在跟踪目标背景区进行patch采样,使codebook兼具描述性和区分性;最后本发明采用了自适应大小的圆形patch,通过在候选目标之间共享patch的权重向量,有效地节约了计算资源。
-
公开(公告)号:CN119027693A
公开(公告)日:2024-11-26
申请号:CN202310590319.3
申请日:2023-05-24
Applicant: 南京大学
IPC: G06V10/74 , G06V10/774 , G06V10/764 , G06V10/75 , G06T7/20 , G06T7/70 , G06V20/40
Abstract: 一种结合孪生网络和快速目标优化的电视跟踪方法,构建一个电视跟踪模型用于跟踪拍摄,电视跟踪模型包括孪生跟踪网络和快速目标优化模块,由孪生跟踪网络根据跟踪模板和搜索区域得到初步跟踪结果,然后由快速目标优化模块自适应更新跟踪使用的跟踪模板,实现在线跟踪以及跟踪器的在线更新。本发明利用孪生网络具备的高效的特征提取能力,能够充分提取目标和搜索区域的特征,通过相似度计算得出初步的跟踪结果,同时采用快速目标优化模块,有效解决了电视跟踪中目标运动轨迹复杂导致的跟踪鲁棒性较低的问题。
-
公开(公告)号:CN118898728A
公开(公告)日:2024-11-05
申请号:CN202310496397.7
申请日:2023-05-05
Applicant: 南京大学
Abstract: 一种群体和谓词并行预测的群体视觉关系检测方法,首先从输入图像中提取物体,根据物体种类和物体视觉特征计算物体相似度,根据相似度将物体划分到多个候选群体中,并将候选群体一一配对组成候选群体对,接着提取物体层级、群体层级、群体对层级的视觉特征、语义特征和位置特征,之后通过交叉注意力编码群体中的物体特征预测物体是否在群体中,并用物体置信度加权物体特征,与群体特征和群体对特征拼接后预测谓词。最后根据物体构成群体的置信度和谓词可能性生成群体视觉关系。本发明基于群体范围与群体视觉关系谓词相互影响的发现,通过并行预测群体范围和谓词类别,找出谓词和群体范围准确匹配的群体视觉关系,具有良好的广泛性。
-
公开(公告)号:CN110706151B
公开(公告)日:2023-08-08
申请号:CN201910859285.7
申请日:2019-09-11
Applicant: 南京大学
Abstract: 一种面向视频的非均匀风格迁移方法,首先对于输入的视频,为每个视频帧上所有像素设定相应的风格化程度,将视频帧表示为一层或多层特征图,同时采用相同的方法将风格图像表示为一层或多层特征图,计算风格迁移中的内容损失、风格损失和时间一致性损失,求和得到总损失函数,最小化风格迁移总损失函数,生成风格迁移结果。供本发明方法解决了视频风格迁移中过度风格化或风格化不足的问题,实现了在突出部分区域内容的同时强烈渲染其它区域的风格,在风格化的过程中更好的平衡风格化视频的内容保持程度和风格渲染程度。
-
公开(公告)号:CN110889397B
公开(公告)日:2023-06-20
申请号:CN201911284548.2
申请日:2019-12-13
Applicant: 南京大学
Abstract: 一种以人为主体的视觉关系分割方法,首先对于输入的图像,提取物体实例分割并分开一般物体和人体,同时对于输入的图像,提取人脸检测结果;然后将从物体实例分割中提取的人体分割和人脸检测结果结合得到更完善的检测分割结果并将物体分割和改善后的人体分割分别作为宾语和主语的图像分割输入预测网络,得到图像中以人为主语的 视觉关系三元组并根据语言先验统计对结果进行筛选。本发明生成的分割定位结果和关系三元组具有较好的准确度,可以为图像搜索、图像说明、图像问答提供支持。
-
公开(公告)号:CN114818819A
公开(公告)日:2022-07-29
申请号:CN202210493558.2
申请日:2022-05-07
Applicant: 南京大学
Abstract: 一种基于毫米波雷达与视觉信号的道路障碍物检测方法,通过毫米波雷达及视觉传感器检测道路前方障碍物,通过融合毫米波雷达与视觉图像两种信号,检测目标物体类别,首先将毫米波雷达信号预处理,将毫米波雷达报文转化为目标点位置的形式,并与视觉图像信号进行时间同步;将毫米波雷达目标点根据坐标匹配关系映射于视觉图像信号之上,实现两种模态的融合;对映射到视觉图像信号上的毫米波雷达信息进行目标检测,最后对检测结果进行尺度估计,细化障碍物信息。本发明实现了多模态细粒度障碍物检测,相比传统单模态方法具有精确度与运行效率上的优势,具备高度实用价值。
-
公开(公告)号:CN112183334A
公开(公告)日:2021-01-05
申请号:CN202011038812.7
申请日:2020-09-28
Applicant: 南京大学
Abstract: 一种基于多模态特征融合的视频深度关系分析方法,基于视频分幕和场景、人物识别的视觉、声音和文字特征融合网络,首先将输入视频根据场景、视觉和声音模型分为多个幕,并在每个幕上提取对应的声音和文字特征,然后根据输入的场景截图和人物截图识别出现在各幕中的位置,并对场景和人物提取对应的实体视觉特征,同时对每两个实体对计算联合区域的视觉特征;对于每个实体对,将幕特征、实体特征和实体对特征连接后通过小样本学习结合零样本学习预测每幕实体对间的关系,通过合并视频每幕上的实体关系,构建整个视频上的实体关系图。本发明利用实体关系图可以回答知识图填充、问题回答和实体关系路径三类深度视频分析问题。
-
公开(公告)号:CN111854616A
公开(公告)日:2020-10-30
申请号:CN202010435589.3
申请日:2020-05-21
Applicant: 南京鸿亦沄智能科技有限公司 , 南京大学
Abstract: 一种激光辅助下的树木胸径视觉测量方法与系统,硬件装置包括:智能手机、激光发射设备、RFID读写设备和手持设备,测量时通过向待测树木发射两束平行激光标记树木,采集带有激光点的树木照片,使照片中两个点激光位于待测量树木胸径位置,两个激光点连线平行于树木生长延伸方向,对该照片进行图像处理,获得待测树木的胸径,同时,由RFID读写设备识别树木的RFDI标签,并将测得胸径与对应树木标签对应存储。本发明设备装置简单、便于携带,可提高树木胸径测量的速率。
-
-
-
-
-
-
-
-
-