-
公开(公告)号:CN107180241A
公开(公告)日:2017-09-19
申请号:CN201710261694.8
申请日:2017-04-20
Applicant: 华南理工大学
CPC classification number: G06K9/4609 , G06K9/626 , G06N3/0454 , G06N3/08
Abstract: 本发明公开了一种基于Gabor特征具有分形结构的极深神经网络的动物分类方法。所述分类方法首先通过单一扩展规则的重复应用生成一个极深的网络(Fractalnet),然后通过从ImageNet数据集中获取一定数量种类的动物图片,进行Gabor特征提取以及归一化等预处理,得到Gabor特征伪彩图之后,利用Gabor特征伪彩图作为网络输入,通过监督学习的方法训练Fractalnet网络模型,最后进行动物图片的测试分类。本发明利用了具有分形结构的极深神经网络在物体分类中的优势,通过加入人工提取的Gabor特征来加强网络对纹理信息的学习,达到对动物图片进行精准分类的目的。
-
公开(公告)号:CN106934352A
公开(公告)日:2017-07-07
申请号:CN201710111507.8
申请日:2017-02-28
Applicant: 华南理工大学
CPC classification number: G06K9/00744 , G06K9/6256 , G06N3/02
Abstract: 本发明公开了一种基于双路分形网络和LSTM的视频描述方法。所述方法首先对待描述视频进行关键帧的采样,并提取原视频相邻两帧之间的光流特征,然后通过两个分形网络分别学习并获得视频帧和光流特征的高层特征表达,再分别输入到两个基于LSTM单元的递归神经网络模型,最后将两个独立模型每个时刻的输出值进行加权平均,从而获得与所述视频对应的描述语句。本发明对待描述视频分别利用了原视频帧和光流的信息,添加的光流特征补偿了采样帧不可避免会丢失的动态信息,考虑到了视频在空间维度和时间维度上的变化。再者,通过新颖的分形网络对底层特征进行抽象的视觉特征表达,从而更精确地分析挖掘视频中涉及的人、物、行为以及空间位置关系等联系。
-
公开(公告)号:CN106650829A
公开(公告)日:2017-05-10
申请号:CN201710003657.7
申请日:2017-01-04
Applicant: 华南理工大学
IPC: G06K9/62
CPC classification number: G06K9/6215
Abstract: 本发明公开了一种图片相似度计算方法,包括:(1)用基于DCT的hash方法分别计算待比较的两个图片的hash值;(2)计算两个hash值之间的汉明距离dis_h;(3)若汉明距离不在设定范围内,直接通过公式计算两图片的相似度;(4)若汉明距离在设定范围内,再用基于径向投影的hash方法计算hash值;(5)计算上一步得到的hash值的皮尔逊相关系数,并结合第二步得到的汉明距离计算两图片的相似度。本发明对图像旋转有一定的鲁棒性、避免伽马校正或颜色直方图被调整带来的影响,提高了图片相似度结果的准确率。
-
公开(公告)号:CN106650813B
公开(公告)日:2019-11-15
申请号:CN201611226528.6
申请日:2016-12-27
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于深度残差网络和LSTM的图像理解方法。所述方法首先构建一个深度残差网络模型提取图像的抽象特征并保存为特征矩阵;然后LSTM模型中的动态注意机制根据特征矩阵动态地生成合适的特征向量,最后LSTM模型根据特征向量生成成自然语言(英语)。本发明利用了深度残差网络在图像特征提取和LSTM对时序序列建模方面的优势,深度残差网络和LSTM模型成了一个编码‑解码框架,将图像内容信息转化成自然语言,达到提取图像的深层次信息的目的。
-
公开(公告)号:CN106650813A
公开(公告)日:2017-05-10
申请号:CN201611226528.6
申请日:2016-12-27
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于深度残差网络和LSTM的图像理解方法。所述方法首先构建一个深度残差网络模型提取图像的抽象特征并保存为特征矩阵;然后LSTM模型中的动态注意机制根据特征矩阵动态地生成合适的特征向量,最后LSTM模型根据特征向量生成成自然语言(英语)。本发明利用了深度残差网络在图像特征提取和LSTM对时序序列建模方面的优势,深度残差网络和LSTM模型成了一个编码‑解码框架,将图像内容信息转化成自然语言,达到提取图像的深层次信息的目的。
-
公开(公告)号:CN107610141B
公开(公告)日:2020-04-03
申请号:CN201710788814.X
申请日:2017-09-05
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于深度学习的遥感图像语义分割方法中,步骤为:为每种物类目标分配RGB值和灰度值,获取原始遥感图像,选取出物类目标并上色、灰度化以及赋予灰度值处理,得到标签图像,对原始遥感图像进行数据增强以及边缘提取,得到边缘提取后的图像;将原始遥感图像和边缘提取后的图像训练样本对完全卷积神经网络进行训练,得到最佳语义分割网络模型,将测试遥感图像输入最佳语义分割网络模型中,获取到语义分割结果图像;为语义分割结果图像进行上色处理,得到最终语义分割结果图像,根据最终语义分割结果图像中的RGB值获取物类目标。本发明方法具有遥感图像语义分割准确率高以及适用性广的优点。
-
公开(公告)号:CN106650829B
公开(公告)日:2019-07-16
申请号:CN201710003657.7
申请日:2017-01-04
Applicant: 华南理工大学
IPC: G06K9/62
Abstract: 本发明公开了一种图片相似度计算方法,包括:(1)用基于DCT的hash方法分别计算待比较的两个图片的hash值;(2)计算两个hash值之间的汉明距离dis_h;(3)若汉明距离不在设定范围内,直接通过公式计算两图片的相似度;(4)若汉明距离在设定范围内,再用基于径向投影的hash方法计算hash值;(5)计算上一步得到的hash值的皮尔逊相关系数,并结合第二步得到的汉明距离计算两图片的相似度。本发明对图像旋转有一定的鲁棒性、避免伽马校正或颜色直方图被调整带来的影响,提高了图片相似度结果的准确率。
-
公开(公告)号:CN107610141A
公开(公告)日:2018-01-19
申请号:CN201710788814.X
申请日:2017-09-05
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于深度学习的遥感图像语义分割方法中,步骤为:为每种物类目标分配RGB值和灰度值,获取原始遥感图像,选取出物类目标并上色、灰度化以及赋予灰度值处理,得到标签图像,对原始遥感图像进行数据增强以及边缘提取,得到边缘提取后的图像;将原始遥感图像和边缘提取后的图像训练样本对完全卷积神经网络进行训练,得到最佳语义分割网络模型,将测试遥感图像输入最佳语义分割网络模型中,获取到语义分割结果图像;为语义分割结果图像进行上色处理,得到最终语义分割结果图像,根据最终语义分割结果图像中的RGB值获取物类目标。本发明方法具有遥感图像语义分割准确率高以及适用性广的优点。
-
-
-
-
-
-
-