时序边界检测方法及时序感知器

    公开(公告)号:CN114494314A

    公开(公告)日:2022-05-13

    申请号:CN202111615241.3

    申请日:2021-12-27

    Applicant: 南京大学

    Abstract: 时序边界检测方法及时序感知器,基于变换解码器结构和注意力机制,建立通用的无类别时序动作检测模型,检测模型的编码器中引入少量隐特征查询量,通过交叉注意力机制将输入特征压缩到固定维度,并使用变换解码器对特征进行解码,实现通用无类别时序边界的稀疏检测。本发明通过特征压缩,有效解决了长视频的时序冗余问题,并将二次模型的复杂度降低到线性级别;构建边界查询量和上下文查询量这两种隐特征查询量,以相应处理视频中语义不连贯的边界区域和连贯的上下文区域,充分利用视频的语义结构;提出基于交叉注意力计算的对齐损失函数,使网络快速稳定收敛;使用变换解码器稀疏编码边界位置,避免复杂后处理,提高模型泛化性能。

    一种对输入信息自适应的显著物体分割方法

    公开(公告)号:CN108428240B

    公开(公告)日:2022-03-25

    申请号:CN201810191703.5

    申请日:2018-03-08

    Applicant: 南京大学

    Abstract: 一种对输入信息自适应的显著物体分割方法,首先采用自适应三阈值算法,从显著性图中生成分割种子,然后扩展GrabCut算法,从而能够根据不同的输入信息自适应地初始化算法,并通过自适应GrabCut算法的到显著物体的粗标注图,最后采用自适应初始化分割,优化显著物体轮廓,得到分割结果。本发明采用一个统一框架来处理不同的输入信息,并根据输入信息的变化动态调整方法的模块步骤,从而综合利用了不同输入信息中的物体特征,提高了显著物体分割的准确性和完整性。

    一种基于多源运动特征融合的时序自适应视频分类方法

    公开(公告)号:CN111209883A

    公开(公告)日:2020-05-29

    申请号:CN202010032965.4

    申请日:2020-01-13

    Applicant: 南京大学

    Abstract: 一种基于多源运动特征融合的时序自适应视频分类方法,包括生成训练样例阶段、网络配置阶段、训练阶段以及测试阶段,采用多源多尺度运动信息进行早期融合,融合包括原视频帧序列信息、段内局部帧间差以及全局段间特征差,并在融合过程中实现时序自适应调整策略,完成视频分类任务。本发明在融合多源运动信息的同时,通过时序自适应调整,适配视频分类任务,获得了鲁棒性强且精度高的视频分类方法,提出了融合全局、原有单帧信息、局部运动信息的方式,这种融合位于网络的浅层,使得相比于其他融合策略而言计算更加快速,且具有很好的移植性。

    一种基于层次式时空区域合并的物体轨迹提议方法

    公开(公告)号:CN108898614A

    公开(公告)日:2018-11-27

    申请号:CN201810569130.5

    申请日:2018-06-05

    Applicant: 南京大学

    Abstract: 一种基于层次式时空区域合并的物体轨迹提议方法,在视频上通过匹配相邻帧的层次式视频帧区域构建视频的层次式时空区域表示,然后通过合并层次式时空区域来产生候选物体轨迹,最后使用一种融合了外观似物性和运动似物性的综合评分机制对候选物体轨迹进行评分,将评分最高的若干个候选物体轨迹作为最终的物体轨迹提议结果。本发明方法融合了视频中物体的外观信息和运动信息,利用整个视频的时空特性来生产物体轨迹提议结果,取得了比现有方法更好的效果。

    一种用PVFS替代Hadoop存储模块的方法

    公开(公告)号:CN104850401B

    公开(公告)日:2018-04-24

    申请号:CN201510229869.8

    申请日:2015-05-07

    Applicant: 南京大学

    Abstract: 一种用PVFS替代HADOOP存储模块的方法,使用并行虚拟文件系统PVFS代替HADOOP的分布式文件系统HDFS模块,本发明实现了从HADOOP到PVFS的连接,主要包括三个模块:PVFS程序接口、HADOOP‑PVFS模块与JNI连接模块。本发明旨在选取一种更适合的分布式文件系统作为HADOOP的存储模块来代替HDFS,以减少HADOOP在文件操作方面的开销,提升HADOOP在MapReduce计算,尤其是数据密集型计算时的表现。

    一种基于运动补偿的双目立体图像编解码方法

    公开(公告)号:CN104902256B

    公开(公告)日:2018-01-09

    申请号:CN201510264650.1

    申请日:2015-05-21

    Applicant: 南京大学

    Inventor: 武港山 周振

    Abstract: 本发明公开了一种快速的基于运动补偿的双目立体图像的编解码方法。本方法通过先对左右图像进行基于固定方块大小的运动估计得到运动向量,然后用运动向量和左图像预测右图像,将右图像与预测值作差得到预测误差即残差图像,然后对残差图像,左图像进行jpeg2000编码,运动向量进行DPCM预测编码并输出。其中运动向量的估计采用半像素精度,半像素精度比整像素精度能使预测更为准确。在实际编码过程中使用解码后的左图像对右图像进行基于运动补偿的预测,这样可以避免左图像压缩的失真带到右图像中。本方法具有快速的优点,能满足快速编码和解码需求。

    一种三维地震解释中基于约束的批量拾取层位面的方法

    公开(公告)号:CN103969683B

    公开(公告)日:2017-02-15

    申请号:CN201410214969.9

    申请日:2014-05-20

    Applicant: 南京大学

    Abstract: 一种三维地震解释中基于约束的批量拾取层位面的方法,利用通过人工拾取的或者通过其他方式拾取的上下两个层位面作为约束面,然后获取约束层位面提供的已知条件,结合将要拾取的中间层位面之间存在相互制约的关系,进行同步拾取约束层位面之间的所有层位面。本发明提供了一种新的增加约束信息的自动拾取多张层位面的方法,该方法结合给定上下约束层位面的信息,提供了对将要拾取的层位面的辅助信息。在经过滤波之后得到的样本点上进行种子地震道蔓延法来拾取层位面,可以提高精确度和时间效率。

    一种基于各向异性中心环绕差异的深度显著性检测方法

    公开(公告)号:CN106023184A

    公开(公告)日:2016-10-12

    申请号:CN201610323842.X

    申请日:2016-05-16

    Applicant: 南京大学

    Inventor: 武港山 陈杰 居然

    CPC classification number: G06K9/4671 G06T2207/10024 G06T2207/10028

    Abstract: 一种基于各向异性中心环绕差异的深度显著性检测方法,先以深度图作为输入,然后对每一张深度图进行高斯平滑处理,计算每一个像素的各向异性中心环绕差异的深度值,最后根据先验知识进行显著性计算和结果提优。由于本发明方法考虑到全局的深度特征,显著性检测结果准确,运算复杂度也较低,使得本发明更适用于深度图像的显著性检测,同时利用两个普遍的先验知识去提纯初始结果,提高显著性检测效果。此外,本发明不占用大量的计算资源,执行效率很高,在图像处理和视觉领域有着广泛的应用。

    基于快速局部匹配的立体图像对象分割方法

    公开(公告)号:CN103714549B

    公开(公告)日:2016-06-08

    申请号:CN201310745606.3

    申请日:2013-12-30

    Applicant: 南京大学

    Abstract: 基于快速局部立体匹配的立体图像对象分割方法,求取图像上的可靠匹配点,运用Delaunay三角化进行插值求视差;然后构建图,将像素作为顶点,像素与其八近邻的连线作为图的边,边的权值由相连像素的颜色和视差信息决定;采用Kruskal最小生成树策略根据边的权值确定相连两个像素所在区域是否属于同一分割区域,如果是则合并,否则保持不变;对得到的分割区域,判断是否属于需要分割出来的对象,取出分割区域,得到最终的对象。本发明方法快速有效,能够有效处理物体边缘等视差不连续区域;能够快速地分割出多个对象,本发明时间效率高,分割效果好,能够满足快速自动对象分割的需求。

    一种基于运动补偿的双目立体图像编解码方法

    公开(公告)号:CN104902256A

    公开(公告)日:2015-09-09

    申请号:CN201510264650.1

    申请日:2015-05-21

    Applicant: 南京大学

    Inventor: 武港山 周振

    Abstract: 本发明公开了一种快速的基于运动补偿的双目立体图像的编解码方法。本方法通过先对左右图像进行基于固定方块大小的运动估计得到运动向量,然后用运动向量和左图像预测右图像,将右图像与预测值作差得到预测误差即残差图像,然后对残差图像,左图像进行jpeg2000编码,运动向量进行DPCM预测编码并输出。其中运动向量的估计采用半像素精度,半像素精度比整像素精度能使预测更为准确。在实际编码过程中使用解码后的左图像对右图像进行基于运动补偿的预测,这样可以避免左图像压缩的失真带到右图像中。本方法具有快速的优点,能满足快速编码和解码需求。

Patent Agency Ranking