-
公开(公告)号:CN117689631A
公开(公告)日:2024-03-12
申请号:CN202311679714.5
申请日:2023-12-08
Applicant: 南京邮电大学
IPC: G06T7/00 , G06V10/26 , G06V10/82 , G06V10/764 , G06N3/0464 , G06N3/084 , G06N3/09
Abstract: 本发明公开了基于混合监督的两阶段轻量化网络的缺陷检测方法、系统,该方法包括收集真实工业环境下的图像数据集,并存储到数据集中;对图像数据集进行一定程度的标注,若样本图像缺陷比较集中,可以使用像素级标注;若样本图像缺陷杂乱无序,标注所需时间成本较大,可以使用图像级标注;搭建由分割子网络和决策子网络组成的两阶段缺陷检测网络,将图像数据集输入到该网络中,通过训练将学习到的特性进行预测,输出图像缺陷检测位置以及预测图像是否存在缺陷。本发明能够自动地分割输入的工业图像的缺陷,并识别该图像是否为缺陷图像,以减轻人力和时间成本,从而提高工业缺陷检测的效率。
-
公开(公告)号:CN109146988B
公开(公告)日:2022-08-30
申请号:CN201810674145.8
申请日:2018-06-27
Applicant: 南京邮电大学
IPC: G06T11/00
Abstract: 本发明公开了一种基于VAEGAN的非完全投影CT图像重建方法,包括:首先,完全投影数据的正弦图像来训练VAEGAN模型,获得可以生成高质量正弦图像的VAEGAN模型;其次,利用已训练的模型对不完全投影数据正弦图缺失部分进行预测,进而可以获取到补全的投影数据;最后,使用卷积滤波反投影(Filtered Back‑Projection,FBP)方法从补全的投影数据图像中重建出CT图像。本发明能够预测缺失投影数据并进一步重建出符合临床诊断、高质量的CT图像。
-
公开(公告)号:CN110852368B
公开(公告)日:2022-08-26
申请号:CN201911068737.6
申请日:2019-11-05
Applicant: 南京邮电大学
IPC: G06K9/62 , G06V10/80 , G06V10/42 , G06V10/44 , G06V10/764 , G06V10/82 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种全局与局部特征嵌入及图文融合的情感分析方法与系统,该方法首先利用卷积神经网络提取图像的全局特征,同时利用迁移学习训练目标检测模型,对图像中携带情感的局部区域进行检测定位,提取局部区域特征并嵌入到全局特征共同训练图像情感分类模型,得到图像的情感极性概率。接着将文本表示为包含丰富语义信息的词向量,输入到可提取文本语义上下文特征的双向LSTM进行情感分类,得到文本的情感的极性概率。最后根据后期融合公式,得到图像及文本融合后的情感极性概率,进行图文情感分析。本发明能有效的关注图文的情感信息,并通过图像的全局与局部情感特征的提取以及文本信息的融合,提高图文情感分类的准确性和鲁棒性。
-
公开(公告)号:CN113658679A
公开(公告)日:2021-11-16
申请号:CN202110787244.9
申请日:2021-07-13
Applicant: 南京邮电大学
Abstract: 本发明公开了一种医学图像下牙槽神经损伤风险自动评估方法,包括以下步骤:获取训练集,所述训练集包括CBCT图像和曲面断层片图像;对CBCT图像的下颌阻生智齿与下牙槽神经管的接触关系进行判断;对训练集图像进行数据增强的方式进行扩充;获取多分辨率目标检测模型;训练多分辨率目标检测模型预测下颌阻生智齿与下牙槽神经管的图像位置;使用非极大值抑制算法求得最终下颌阻生智齿与下牙槽神经管位置以及两者的接触关系;本发明能全自动判断曲面断层片图像中智齿与神经管的具体位置,同时,对智齿与神经管的接触关系进行预测,有效地降低了口腔颌面科医生人工定位的工作量与消耗时间。
-
公开(公告)号:CN108363753B
公开(公告)日:2020-05-19
申请号:CN201810086816.9
申请日:2018-01-30
Applicant: 南京邮电大学
Abstract: 本发明公开了评论文本情感分类模型训练与情感分类方法、装置及设备,属于自然语言处理的文本情感分类领域。模型训练包括:获取评论文本、关联的主体和客体信息;基于第一层Bi‑LSTM网络融入评论主体和客体注意力机制提取句子级特征表示;在基于第二层Bi‑LSTM网络融入评论主体和客体注意力机制提取文档级特征表示;采用双曲正切非线性映射函数将文档级特征映射至情感类别空间,采用softmax分类,对模型中的参数进行训练,得到最优文本情感分类模型。本发明采用层次双向Bi‑LSTM网络模型和注意力机制,不仅可以实现文本的上下文语义稳健感知与语义表达,还可以显著改善文本情感分类的鲁棒性,提高分类正确率。
-
公开(公告)号:CN109461188B
公开(公告)日:2019-04-26
申请号:CN201910088695.6
申请日:2019-01-30
Applicant: 南京邮电大学
IPC: G06T7/73
Abstract: 本发明公开了一种二维X射线头影测量图像解剖特征点自动定位方法,属于图像处理技术领域。首先计算X射线头影测量图像中每个解剖特征点的偏移距离图,将其和头影测量图像作为训练数据。其次,基于卷积神经网络模型构建自动编码生成对抗性网络,并将已有训练数据作为输入,训练该网络预测针对目标解剖特征点的偏移距离图。再次,当获得新的X射线头影测量图像时,将训练好的自动编码生成对抗性网络作用于新图像,以获得目标解剖特征点的偏移距离图。最后,使用回归投票方法从偏移距离图中求得目标解剖特征点坐标。本发明能自动、准确地获得二维X线头影测量图像中解剖特征点位置。
-
公开(公告)号:CN109360232A
公开(公告)日:2019-02-19
申请号:CN201811049134.7
申请日:2018-09-10
Applicant: 南京邮电大学
Abstract: 本发明公开了一种基于条件生成对抗网络的室内场景布局估计方法和装置,该方法包括:运用训练集训练条件生成对抗网络,将待测室内图像输入至训练完成的条件生成对抗网络,预测生成与输入图像尺寸相同的布局边缘图;估计待测室内图像的消失点,从每个消失点等角度间隔引出射线,生成若干扇形区域;根据平均边缘强度最大准则确定采样扇形区域;对预测布局边缘图加高斯模糊,然后对采样扇形区域进行采样生成布局候选项;选出与预测布局边缘图最为相似的空间布局作为最终的布局估计结果。本发明为生成场景布局边界图提供更加完整的原始信息,无需显式假设数据的参数分布,能提高布局估计的准确率,在室内场景理解和三维重建任务中具有重要的应用价值。
-
公开(公告)号:CN107424161A
公开(公告)日:2017-12-01
申请号:CN201710274710.7
申请日:2017-04-25
Applicant: 南京邮电大学
IPC: G06T7/13
Abstract: 本发明公开了一种由粗至精的室内场景图像布局估计方法,首先基于Canny边缘检测结果,设置阈值获得相应长直线段,对长直线段进行方向上的归类并估计消失点,进而生成大量布局候选项;然后,构建以VGG-16为原型的全卷积神经网络预测信息化边界图,并将fc7层提取特征经Softmax分类器获得布局类别信息,两者融合生成全局特征进行布局候选项的粗选取;最后,建立布局估计的结构化回归模型,在提取线段、几何上下文、法向量和深度等信息的基础上,经几何积分图像形成区域级特征,实现布局候选项到特征域的映射的同时进行特征参数的学习,从而获得布局估计参数模型。该方法提高了布局估计的准确率,在室内场景的3D重建中具有重要的应用价值。
-
公开(公告)号:CN104598890B
公开(公告)日:2017-07-28
申请号:CN201510051252.1
申请日:2015-01-30
Applicant: 南京邮电大学
Abstract: 本发明公开了一种基于RGB‑D视频的人体行为识别方法,属于计算机视觉的行为识别技术领域。该方法根据RGB‑D视频中不同类别的人体行为动作具有不同的运动信息、几何信息和纹理信息,对RGB‑D摄像机获取的RGB‑D视频分别提取稠密MovingPose特征、SHOPC特征和HOG3D特征,采用边缘限制的多核学习方法对三种特征进行特征融合,最后采用Exemplars‑SVM线性分类器对人体行为动作进行判决。相比现有技术,本发明中所采用的提取的三种特征融合后具有光照不变性、尺度不变性和视角不变性,对动作执行者之间的外形差异和行为动作过程差异都具有显著的鲁棒性,在一定程度上能提高人体行为动作的识别准确度。
-
公开(公告)号:CN104268507A
公开(公告)日:2015-01-07
申请号:CN201410469195.4
申请日:2014-09-15
Applicant: 南京邮电大学
CPC classification number: G06K9/00355 , G06K9/36 , G06K9/6269
Abstract: 本发明公开了一种基于RGB-D图像的手语字母识别方法,属于计算机视觉的行为识别技术领域。该方法根据不同的手语字母类型具有不同的手型纹理信息,对RGB-D摄像机获取的RGB-D图像视频帧提取梯度方向直方图特征和超法向量特征,采用主成分分析与线性判别分析相结合的方法进行特征属性优化处理,获取具有显著性的特征属性,并进一步对特征进行分组词典稀疏表示;采用对比数据挖掘技术,获取各个手语字母类别中具有代表性的模板实例;最后采用基于贪婪思想的分层判决策略,先采用非参数的k最近邻分类器将易分的手语字母类别快速分类,对于难以区分的手语字母采用训练的基于模板的支持向量机模型进行判决。相比现有技术,本发明的识别准确度及识别效率均较高。
-
-
-
-
-
-
-
-
-