一种对形状鲁棒的自然场景中文本检测的方法

    公开(公告)号:CN110008950A

    公开(公告)日:2019-07-12

    申请号:CN201910189627.9

    申请日:2019-03-13

    Applicant: 南京大学

    Abstract: 本发明公开了一种对形状鲁棒的自然场景中文本检测的方法,包括如下步骤:步骤1,对文本数据集中的训练图片进行预处理;步骤2,搭建PSENet进步式尺度生长网络,利用所述进步式尺度生长网络完成对训练图片的特征提取、特征融合以及分割预测,得到多个预测尺度的分割结果;步骤3,对步骤2中搭建的PSENet进步式尺度生长网络进行监督训练得到检测器模型;步骤4,对待检测图片进行检测;步骤5,使用尺度生长算法得到最终检测结果。

    基于线阵式摄像机的双向实时车辆底盘图像合成方法

    公开(公告)号:CN105376485B

    公开(公告)日:2018-06-29

    申请号:CN201510758083.5

    申请日:2015-11-09

    Applicant: 南京大学

    Abstract: 本发明提供了基于线阵式摄像机的双向实时车辆底盘图像合成方法,其中实时数据分析及拼接,包括以下步骤:步骤(1),接受到拼接信号后,取得线阵式摄像机每帧的图像,保存至临时文件夹,直至拼接信号结束;步骤(2),利用Sobel算子,计算每张图中是否存在有效内容,将有效图片路径保存至数组当中;步骤(3),根据数组中图片路径,将图片正序拼接为一张底盘合成图片;步骤(4),调整合成图片的分辨率和比例。本发明满足了大多数应用场合。本发明中的控制方法使得车辆底盘拼接自动实时完成,杜绝漏检发生,所得车底盘图像完整,清晰度高分辨率达数百万像素,支持双向实时拼接,适应大多数应用场景。

    一种基于多尺度全局特征和局部特征的图像分类方法

    公开(公告)号:CN104766096B

    公开(公告)日:2017-11-10

    申请号:CN201510186133.7

    申请日:2015-04-17

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于多尺度全局特征和局部特征的图像分类方法,该方法利用图像中的文本信息,提取有效显著区域并计算显著区域中的颜色特征和空间分布特征,利用小波图像金字塔得到多尺度全局特征,利用四分树算法得到局部特征;最终结合多尺度全局特征和局部特征对图像进行分类,该方法的分类正确率可以到达88%。通过分别对分类前后的图像进行文本检测和识别的对比实验发现,图像分类能够有效提高图像中文本信息的检测与识别。

    一种用于模糊视频文本信息增强的多光谱融合方法

    公开(公告)号:CN104835128B

    公开(公告)日:2017-05-24

    申请号:CN201510186012.2

    申请日:2015-04-17

    Applicant: 南京大学

    Inventor: 路通 翁炀冰

    Abstract: 本发明公开了一种用于模糊视频文本信息增强的多光谱融合方法,包括以下步骤:步骤1,输入一个待增强文字信息的模糊视频帧;步骤2,将输入视频帧分别转化为灰度图、R值图、G值图和B值图,并分别进行简单的增强操作;步骤3,将灰度图、R值图、G值图和B值图的增强图按照最小值、最大值、和值、均值、中值操作融合成五幅图;步骤4,将五幅融合图分别进行k等于2的k‑means操作,得到五幅二值图;步骤5,将五幅二值图按照中值操作融合成增强图,完成增强工作。

    基于分层事件检测和上下文模型的多源场景声音摘要方法

    公开(公告)号:CN104167211B

    公开(公告)日:2017-03-22

    申请号:CN201410391254.0

    申请日:2014-08-08

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于分层事件检测和上下文模型的多源场景声音摘要方法,包括以下步骤:步骤一,输入一段待摘要的目标多源场景音频分割片段;步骤二,基于背景声音对音频场景片段进行分割;步骤三,通过一个谱聚类算法,将目标音频中相似的分割片段聚类起来,利用仿射函数检测背景声音事件,并计算声音事件的评分函数得到关键声音事件;步骤四,通过一个上下文模型计算声音事件之间的相关函数;步骤五,根据声音事件之间的相关值在关键声音事件的音频分割片段前后合并相关度较高的音频分割片段得出最后的多源场景声音摘要。(56)对比文件Antti J. Eronen et al“.Audio-BasedContext Recognition”《.IEEE TRANSACTIONSON AUDIO, SPEECH, AND LANGUAGEPROCESSING》.2006,第14卷(第1期),赵丕锡等“.视频概要的分类与综合评价方法”《.计算机应用研究》.2004,(第11期),戴玉名.“基于分层代表帧提取的视频摘要研究_”《.中国优秀硕士学位论文全文数据库信息科技辑》.2010,(第10期),Toni Heittola et al“.Sound EventDetection in Multisource EnvironmentsUsing Source Separation”《.Workshop OnMachine Listening in MultisourceEnvironment 2011》.2011,

    一种计算三维模型处理中三维网格拓扑结构图构造方法

    公开(公告)号:CN104766367A

    公开(公告)日:2015-07-08

    申请号:CN201510170596.4

    申请日:2015-04-10

    Applicant: 南京大学

    Abstract: 本发明公开了一种计算三维模型处理中三维网格拓扑结构图构造方法,该拓扑结构图以模型中特征函数极值面片为起点,在增量式添加邻接特征函数值最小面片的过程中,通过对三维模型中几何形状特征提取来计算单纯复形初始生长序列,进而计算该生长序列中各单纯复形的独立环拓扑。提取的独立环约束融合了拓扑特征和几何特征,改进了对拓扑性质利用的现有局限,不仅能够更为准确描述模型,还能够简化相关算法的复杂性和处理难度。实验表明,本发明提出的拓扑结构图可以在三维模型分割和三维模型检索的典型应用取得良好效果。

    矩形窗口中椭圆曲线的快速裁剪方法

    公开(公告)号:CN102509258B

    公开(公告)日:2013-05-01

    申请号:CN201110301235.0

    申请日:2011-10-08

    Applicant: 南京大学

    Inventor: 路通 陆添超

    Abstract: 本发明公开了一种矩形窗口中椭圆曲线的快速裁剪方法,对任意给定的椭圆弧,该方法按各类椭圆弧出现的概率及所需操作,先后通过椭圆弧的整体包围盒,各分割后的象限椭圆弧,矩形窗口顶点相对于象限椭圆弧段的内外测试,划分的椭圆弧子段的相关性测试,以较少的操作、尽可能多的排除与矩形窗口不相交的椭圆弧;对剩余的需要求交操作才能完成裁剪的椭圆弧,通过查表法快速获取椭圆弧与矩形窗口边的交点。本发明的有益之处是,对任意待裁剪椭圆弧,仅需几次移位、整数加减或少量乘除法运算,即可快速获取其裁剪结果,椭圆弧裁剪效率有很大提高。此外,由于椭圆弧裁剪是图形学及CAD的基础问题之一,该方法可广泛应用于各类绘图软件、建模软件、CAD软件及复杂工程图设计系统等。

    一种跨媒体间信息分析与检索的方法

    公开(公告)号:CN102693321A

    公开(公告)日:2012-09-26

    申请号:CN201210180782.2

    申请日:2012-06-04

    Inventor: 路通 林婉霞

    Abstract: 本发明提供了一种跨媒体间信息分析与检索的方法,包含如下步骤:对多模态信息进行语义融合处理;根据概率潜在语义分析模型扩展得到用于处理连续特征向量的多层连续概率潜在语义分析模型;采用不对称学习方法学习多层连续概率潜在语义分析模型,计算图像的视觉特征向量分布、音频的听觉特征向量分布及主题概率分布;用户提交训练集和测试的媒体对象作为检索例子,计算检索例子中图像、音频的模态内和模态间的初始相似度值;构建传播模型,根据传播模型更新模态内和模态间的相似度值;根据更新后的相似度值进行二次检索。

    一种基于贝叶斯和面元模型的增量三维重建方法

    公开(公告)号:CN102496184A

    公开(公告)日:2012-06-13

    申请号:CN201110411429.6

    申请日:2011-12-12

    Applicant: 南京大学

    Inventor: 袁泽寰 路通

    Abstract: 本发明公开一种基于贝叶斯和面元模型的增量三维重建方法,包括以下步骤:步骤一,得到每一视角对应二维图像的投影矩阵;步骤二,对所有的二维图像建立一个球模型,采样一组关键视角对应的二维图像;步骤三,对所述关键视角对应的二维图像进行基于面元的三维重建得到面元云;步骤四,在球模型上定位一个新视角对应的二维图像并对球模型进行更新;步骤五,从面元云中选取一个面元子集;步骤六,比较面元子集中局部三维表面面元密度与面元云的三维表面面元密度平均值;步骤七,通过贝叶斯进行建模,从而实现增量三维重建。本发明实现增量重建可用于将来实时的三维重建和多分辨率重建,可以在任何时间点对已有的相关三维模型进行更新。

    基于监控视频内容提取车辆底盘图像的合成方法

    公开(公告)号:CN101945257B

    公开(公告)日:2012-03-28

    申请号:CN201010264070.X

    申请日:2010-08-27

    Applicant: 南京大学

    Abstract: 本发明提供了一种基于监控视频内容提取车辆底盘图像的合成方法,主要包括如下步骤:取帧转为灰度图片,进行预处理操作;形成运动区域不规则多边形;通过面积筛除部分不规则多边形;形成矩形包围盒;w-SIFT算法匹配;计算Y向平均偏移距离;做x方向的拉伸变换;图像拼接以及平滑过渡。本发明的有益效果在于:输入一段车辆底盘监控视频,可自动将其转换为包括该车辆完整底盘描述的单一静态图像,该图像可用于进一步的图像识别等。该方法可节省大量人工拼接图片的时间开销,并显著提高拼接后的效果;得到的结果可以直观反应监控视频所要表达的重要内容。

Patent Agency Ranking