-
公开(公告)号:CN107480728A
公开(公告)日:2017-12-15
申请号:CN201710748676.2
申请日:2017-08-28
Applicant: 南京大学
CPC classification number: G06K9/6269 , G06K9/4604
Abstract: 本发明公开了一种基于傅里叶残差值的打印文档鉴别方法,解决打印文档之间没有相同字符或者相同字符较少的情况下的鉴别问题。具体方法是:获取一张打印文档的文档图像;提取文档图像的文本行,找到最大的打印区域;提取文档图像的傅里叶残差图,在残差图上提取灰度,熵的统计特征,对这些特征利用分类器进行分类。基于傅里叶残差值的打印文档鉴别方法,可以很好的区分不同打印机之间的打印特性,同时,也不需要打印文档之间有太多相同字符,提高了打印文档鉴别方法的适用范围和准确率。
-
公开(公告)号:CN107480648A
公开(公告)日:2017-12-15
申请号:CN201710728404.6
申请日:2017-08-23
Applicant: 南京大学 , 深圳互连科技有限公司
Abstract: 本发明公开了一种用于自然场景文字检测的方法,包括以下步骤:步骤1,输入一张待检测文字的图片;步骤2,提取输入图片的极值区域,并通过极值区域的面积、周长、欧拉数和色彩分布来过滤掉多余的极值区域,得到字符候选区域;步骤3,提取每个字符候选区域的边缘图像,并计算边缘图像的COLD特征;步骤4,将字符候选区域的COLD特征输入预先训练好的随机森林分类器,判断该字符候选区域是不是真正的字符区域;步骤5,将字符区域合并,得到最终的文字区域,完成场景文字检测任务。本发明检测方法具有很强的鲁棒性,检测效率高,可以快速完成文字检测。
-
公开(公告)号:CN104156979B
公开(公告)日:2016-09-14
申请号:CN201410361276.2
申请日:2014-07-25
Applicant: 南京大学
IPC: G06T7/20
Abstract: 本发明公开了一种基于高斯混合模型的视频中异常行为在线检测方法,首先从视频中提取原图像序列,对原图像序列中的每张图像执行步骤一至步骤四:步骤一,合成原图像的低分辨率图像;步骤二,分别计算原图像和低分辨率图像中的光流;步骤三,分别按照原图像和低分辨率图像各自的划分方法将这两种图像划分成图像块;步骤四,为原图像和低分辨率图像中每个图像块计算对应的高斯混合模型;步骤五,计算图像块序列的标准高斯混合模型;步骤六,将原图像序列的下一张图像作为待检测图像,按照步骤1至步骤4计算待检测图像中每个图像块的高斯混合模型;步骤七,判断待检测图像中每个图像块是否存在异常行为;步骤八,标记异常图像块并输出。
-
公开(公告)号:CN104835128A
公开(公告)日:2015-08-12
申请号:CN201510186012.2
申请日:2015-04-17
Applicant: 南京大学
IPC: G06T5/20
Abstract: 本发明公开了一种用于模糊视频文本信息增强的多光谱融合方法,包括以下步骤:步骤1,输入一个待增强文字信息的模糊视频帧;步骤2,将输入视频帧分别转化为灰度图、R值图、G值图和B值图,并分别进行简单的增强操作;步骤3,将灰度图、R值图、G值图和B值图的增强图按照最小值、最大值、和值、均值、中值操作融合成五幅图;步骤4,将五幅融合图分别进行k等于2的k-means操作,得到五幅二值图;步骤5,将五幅二值图按照中值操作融合成增强图,完成增强工作。
-
公开(公告)号:CN104766096A
公开(公告)日:2015-07-08
申请号:CN201510186133.7
申请日:2015-04-17
Applicant: 南京大学
IPC: G06K9/62
Abstract: 本发明公开了一种基于多尺度全局特征和局部特征的图像分类方法,该方法利用图像中的文本信息,提取有效显著区域并计算显著区域中的颜色特征和空间分布特征,利用小波图像金字塔得到多尺度全局特征,利用四分树算法得到局部特征;最终结合多尺度全局特征和局部特征对图像进行分类,该方法的分类正确率可以到达88%。通过分别对分类前后的图像进行文本检测和识别的对比实验发现,图像分类能够有效提高图像中文本信息的检测与识别。
-
公开(公告)号:CN104167211A
公开(公告)日:2014-11-26
申请号:CN201410391254.0
申请日:2014-08-08
Applicant: 南京大学
IPC: G10L19/022 , G10L19/02 , G10L25/48
Abstract: 本发明公开了一种基于分层事件检测和上下文模型的多源场景声音摘要方法,包括以下步骤:步骤一,输入一段待摘要的目标多源场景音频分割片段;步骤二,基于背景声音对音频场景片段进行分割;步骤三,通过一个谱聚类算法,将目标音频中相似的分割片段聚类起来,利用仿射函数检测背景声音事件,并计算声音事件的评分函数得到关键声音事件;步骤四,通过一个上下文模型计算声音事件之间的相关函数;步骤五,根据声音事件之间的相关值在关键声音事件的音频分割片段前后合并相关度较高的音频分割片段得出最后的多源场景声音摘要。
-
公开(公告)号:CN103986912A
公开(公告)日:2014-08-13
申请号:CN201410217514.2
申请日:2014-05-21
Applicant: 南京大学
Abstract: 本发明提供了基于民用IPC的双向实时车辆底盘图像合成方法,其中实时处理数据帧序列并进行拼接,包括以下步骤:步骤(1),取得IPC数据帧,根据IPC畸变参数进行数据帧校正并提取候选配准区域;步骤(2),计算相邻数据帧偏移增量;步骤(3),偏移增量修正后融合拼接;步骤(4),循环执行步骤(1)~(3)直到收到停止拼接信号。本发明满足了大多数应用场合。本发明中的控制方法使得车辆底盘拼接自动实时完成,杜绝漏检发生,所得车底盘图像完整,清晰度高分辨率达数百万像素,支持双向实时拼接,适应大多数应用场景。
-
公开(公告)号:CN101488227B
公开(公告)日:2011-04-06
申请号:CN200810243874.4
申请日:2008-12-09
Applicant: 南京大学
IPC: G06T11/00
Abstract: 本发明公开了一种圆弧在矩形窗口下的快速裁剪方法,对任意给定的圆弧段,该方法按各类圆弧出现概率及所需操作,先后通过圆弧整体包围盒、各分割后的象限圆弧段包围盒、裁剪窗口顶点相对于象限圆弧段的内外测试,以较少的操作尽可能多地排除与裁剪窗口不相交的圆弧;对剩余需求交操作完成裁剪的圆弧,通过查表法快速获取圆弧与裁剪窗口边的交点。本发明的有益之处是,对任意待裁剪圆弧,仅需几次移位、整数加减或少量乘除法运算,即可快速获取其裁剪结果,圆弧裁剪效率有很大提高。此外,由于圆弧裁剪是图形学及CAD的基础问题,该方法可广泛应用于各类绘图软件、建模软件、CAD软件及复杂工程图设计系统等。
-
公开(公告)号:CN101488227A
公开(公告)日:2009-07-22
申请号:CN200810243874.4
申请日:2008-12-09
Applicant: 南京大学
IPC: G06T11/00
Abstract: 本发明公开了一种圆弧在矩形窗口下的快速裁剪方法,对任意给定的圆弧段,该方法按各类圆弧出现概率及所需操作,先后通过圆弧整体包围盒、各分割后的象限圆弧段包围盒、裁剪窗口顶点相对于象限圆弧段的内外测试,以较少的操作尽可能多地排除与裁剪窗口不相交的圆弧;对剩余需求交操作完成裁剪的圆弧,通过查表法快速获取圆弧与裁剪窗口边的交点。本发明的有益之处是,对任意待裁剪圆弧,仅需几次移位、整数加减或少量乘除法运算,即可快速获取其裁剪结果,圆弧裁剪效率有很大提高。此外,由于圆弧裁剪是图形学及CAD的基础问题,该方法可广泛应用于各类绘图软件、建模软件、CAD软件及复杂工程图设计系统等。
-
公开(公告)号:CN101144711A
公开(公告)日:2008-03-19
申请号:CN200710134005.3
申请日:2007-10-17
Applicant: 南京大学
CPC classification number: Y02P90/265
Abstract: 本发明提供了一种关联工程图环境下全局坐标的自动定位方法,该方法通过自动识别工程图中的尺寸线,逐步组合成正交轴网、局部逻辑坐标系和全局逻辑坐标系并记录相应变换矩阵,然后接收任一图纸坐标输入,即可根据对应的变换矩阵计算得到多关联图整合条件下的全局逻辑坐标。本发明的有益之处是,从CAD环境中输入一组以不同比例、方向绘制的关联图,将任一工程图中任一图纸坐标自动精确转换到其对应的全局逻辑坐标,可用于在全局环境下对任一工程对象精确定位,从而节省大量人工计算开销,有效提高计算机辅助设计效率,并可进一步用于三维重建、各种工程数据精确计算等。该方法具有较高的通用性,可适用于多种工程领域。
-
-
-
-
-
-
-
-
-