-
公开(公告)号:CN106503715B
公开(公告)日:2019-01-29
申请号:CN201610975596.6
申请日:2016-11-07
Applicant: 南京大学
IPC: G06K9/34
Abstract: 本发明公开了基于深度学习的自然场景多语言文本检测方法,包括步骤为:转为灰度图片,构建ER树,获取LER,移除其中重复的LER,区分文字和背景杂质,种子生长、聚类,用随机森林进行文本识别。其中,区分文字和背景杂质时,使用了两阶段CNN,其中一阶CNN用于将背景杂质与类文字符号Symbol区分开来;二阶CNN用于将类文字符号Symbol细划分为中文、英文以及标识符Sign,并去除其中的标识符Sign,使含有中文和英文的组件被保留下来。采用上述方法后,能够检测自然场景下的多语言文本以及断裂的文字。另外,与现有技术相比,本技术在自然场景下拥有较好的鲁棒性,对于多语言的复杂环境下也能较好适用,同时有不低于现有技术的检测速度。
-
公开(公告)号:CN108765326A
公开(公告)日:2018-11-06
申请号:CN201810479742.5
申请日:2018-05-18
Applicant: 南京大学
CPC classification number: G06T5/003 , G06T7/33 , G06T2207/30181
Abstract: 本发明提出一种同步定位与地图构建方法,所述方法包括:在当前帧图像中,分别提取第一类关键点和第二类关键点,所述第一类关键点用于与邻近帧进行特征匹配得到初始位姿,第二类关键点用于在初始位姿的基础上进行块匹配生成稳定位姿,以完成同步定位与地图构建;其中,所述第一类关键点和第二类关键点的提取方法不同。本发明仅使用少量特征点进行特征匹配来获得可靠的初始位姿,有效降低了计算规模以保证实时性,然后通过更为高效的块匹配算法匹配关键点,对初始位姿进行优化,提高地图精度。
-
公开(公告)号:CN108763874A
公开(公告)日:2018-11-06
申请号:CN201810545914.4
申请日:2018-05-25
Applicant: 南京大学
IPC: G06F19/24
Abstract: 本发明提出一种基于生成对抗网络的染色体分类方法,所述方法包括:将染色体样本图像利用生成对抗网络进行数据扩充得到染色体模拟图像,利用染色体样本图像和/或染色体模拟图像训练分类器,并根据所述分类器进行染色体分类,所述生成对抗网络的输入为:染色体样本图像数据和多维向量数据;其中,所述多维向量数据包括一组多分布生成的随机向量和一组用于表示染色体类别的特征向量;所述特征向量的维度与染色体样本图像中染色体类别数量一致。使用多个分布的随机生成数据代替原始的单一分布随机数据来训练生成对抗网络,生成对抗网络对原有少量染色体图像数据进行数据增强,然后使用增强后的数据训练分类器,从而提高染色体分类的准确率。
-
公开(公告)号:CN107741924A
公开(公告)日:2018-02-27
申请号:CN201711025018.7
申请日:2017-10-26
Applicant: 南京大学
Abstract: 本发明公开了一种计算机处理复杂表单的方法,执行如下步骤:步骤1,对表单图像进行预处理;步骤2,提取出表格区域中的所有表格单元格;步骤3,分析单元格内信息键值对的逻辑关系,基于ABNF范式设计规则;步骤4,根据步骤3中设计的规则使用开源词法分析器Lex和语法分析器Yacc构造编译器;步骤5,使用设计的语言描述表格单元格,通过解析描述语言得到表格单元格内逻辑结构。
-
公开(公告)号:CN103914571B
公开(公告)日:2017-02-15
申请号:CN201410172378.X
申请日:2014-04-25
Applicant: 南京大学
IPC: G06F17/30
Abstract: 本发明公开了基于网格分割的三维模型检索方法,包括以下步骤:通过分层谱分析构造分割场,包括:凹顶点判断,拉普拉斯矩阵构造,矩阵分解与低频特征向量选择,子特征向量生成与子特征向量权重计算以及边符号矩阵构造。在分割场中采样等值线,利用分组-合并算法对等值线分组和合并,得到若干候选等值线组集合,根据候选等值线组中每条等值线的权重确定最终的分割边界,完成三维模型自动分割。通过计算三维模型每个分割块的特征描述子矩阵得到三维模型混合特征描述子矩阵,并分别计算待检索的目标三维模型与待检索的三维模型数据库中的每一个三维模型的混合特征描述子矩阵的相似度,将三维模型间的相似度数值从低到高排序输出,完成三维模型检索。
-
公开(公告)号:CN105376485A
公开(公告)日:2016-03-02
申请号:CN201510758083.5
申请日:2015-11-09
Applicant: 南京大学
CPC classification number: H04N5/23232 , H04N5/23238 , H04N7/181 , H04N9/09
Abstract: 本发明提供了基于线阵式摄像机的双向实时车辆底盘图像合成方法,其中实时数据分析及拼接,包括以下步骤:步骤(1),接受到拼接信号后,取得线阵式摄像机每帧的图像,保存至临时文件夹,直至拼接信号结束;步骤(2),利用Sobel算子,计算每张图中是否存在有效内容,将有效图片路径保存至数组当中;步骤(3),根据数组中图片路径,将图片正序拼接为一张底盘合成图片;步骤(4),调整合成图片的分辨率和比例。本发明满足了大多数应用场合。本发明中的控制方法使得车辆底盘拼接自动实时完成,杜绝漏检发生,所得车底盘图像完整,清晰度高分辨率达数百万像素,支持双向实时拼接,适应大多数应用场景。
-
公开(公告)号:CN104156979A
公开(公告)日:2014-11-19
申请号:CN201410361276.2
申请日:2014-07-25
Applicant: 南京大学
IPC: G06T7/20
Abstract: 本发明公开了一种基于高斯混合模型的视频中异常行为在线检测方法,首先从视频中提取原图像序列,对原图像序列中的每张图像执行步骤一至步骤四:步骤一,合成原图像的低分辨率图像;步骤二,分别计算原图像和低分辨率图像中的光流;步骤三,分别按照原图像和低分辨率图像各自的划分方法将这两种图像划分成图像块;步骤四,为原图像和低分辨率图像中每个图像块计算对应的高斯混合模型;步骤五,计算图像块序列的标准高斯混合模型;步骤六,将原图像序列的下一张图像作为待检测图像,按照步骤1至步骤4计算待检测图像中每个图像块的高斯混合模型;步骤七,判断待检测图像中每个图像块是否存在异常行为;步骤八,标记异常图像块并输出。
-
公开(公告)号:CN103971102A
公开(公告)日:2014-08-06
申请号:CN201410217546.2
申请日:2014-05-21
Applicant: 南京大学
IPC: G06K9/00
Abstract: 本发明公开了一种基于手指轮廓和决策树的静态手势识别方法。该方法首先使用Kinect的深度图像作为数据源,通过Kinect骨骼追踪功能定位手掌的大致坐标,以该坐标为中心截取出包含手掌的一块正方形区域;然后使用自适应邻近值法对该区域进行前景检测,对前景图像进行适当的图像形态学处理后,检测手掌轮廓;接着使用圆周序列曲线对手掌轮廓进行建模,利用极值点对法准确地区分出各个手指轮廓和手腕轮廓并建立手势特征集;最后使用多个决策树针对不同手指个数的手势特征集分别进行训练以及识别。
-
公开(公告)号:CN103914571A
公开(公告)日:2014-07-09
申请号:CN201410172378.X
申请日:2014-04-25
Applicant: 南京大学
IPC: G06F17/30
CPC classification number: G06F17/30271
Abstract: 本发明公开了基于网格分割的三维模型检索方法,包括以下步骤:通过分层谱分析构造分割场,包括:凹顶点判断,拉普拉斯矩阵构造,矩阵分解与低频特征向量选择,子特征向量生成与子特征向量权重计算以及边符号矩阵构造。在分割场中采样等值线,利用分组-合并算法对等值线分组和合并,得到若干候选等值线组集合,根据候选等值线组中每条等值线的权重确定最终的分割边界,完成三维模型自动分割。通过计算三维模型每个分割块的特征描述子矩阵得到三维模型混合特征描述子矩阵,并分别计算待检索的目标三维模型与待检索的三维模型数据库中的每一个三维模型的混合特征描述子矩阵的相似度,将三维模型间的相似度数值从低到高排序输出,完成三维模型检索。
-
公开(公告)号:CN102411794B
公开(公告)日:2013-11-06
申请号:CN201110214484.6
申请日:2011-07-29
Applicant: 南京大学
IPC: G06T15/00
Abstract: 本发明公开了一种基于球谐变换的三维模型的二维投影的输出方法,包括以下步骤:步骤一,输入待投影的三维模型;步骤二,计算三维模型的质心坐标,然后对三维模型进行规范化;步骤三,对三维模型进行分层采样;步骤四,使用蒙特卡罗积分方法,计算三维模型的球谐特征,并由采样点计算转换因子;步骤五,根据所述转换因子和三维模型的球谐特征,计算投影后的二维球谐特征;步骤六,根据二维球谐特征,计算投影后的二维信息。
-
-
-
-
-
-
-
-
-