-
公开(公告)号:CN109344693A
公开(公告)日:2019-02-15
申请号:CN201810912957.1
申请日:2018-08-13
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于深度学习的人脸多区域融合表情识别方法,包括下述步骤:用检测模型检测出人脸位置;用关键点模型得到人脸关键点坐标;先根据眼睛部分关键点做眼睛对齐;然后根据整体人脸关键点坐标做人脸对齐,并通过仿射变换裁剪人脸区域;按照一定的比例裁剪图像的眼睛和嘴巴区域。卷积神经网络分为一个主干网络和两个支干网络,在最后一层卷积层进行特征融合,最后通过分类器得到表情分类结果。本发明利用先验信息,除整个人脸之外还将眼睛和嘴巴区域作为网络的输入,通过模型融合使网络既能学习到人脸表情的整体语义特征也能学习到局部区域特征,简化了人脸表情识别的难度,减少外部噪声,有鲁棒性强,准确率高,算法复杂度低等优点。
-
公开(公告)号:CN107180241A
公开(公告)日:2017-09-19
申请号:CN201710261694.8
申请日:2017-04-20
Applicant: 华南理工大学
CPC classification number: G06K9/4609 , G06K9/626 , G06N3/0454 , G06N3/08
Abstract: 本发明公开了一种基于Gabor特征具有分形结构的极深神经网络的动物分类方法。所述分类方法首先通过单一扩展规则的重复应用生成一个极深的网络(Fractalnet),然后通过从ImageNet数据集中获取一定数量种类的动物图片,进行Gabor特征提取以及归一化等预处理,得到Gabor特征伪彩图之后,利用Gabor特征伪彩图作为网络输入,通过监督学习的方法训练Fractalnet网络模型,最后进行动物图片的测试分类。本发明利用了具有分形结构的极深神经网络在物体分类中的优势,通过加入人工提取的Gabor特征来加强网络对纹理信息的学习,达到对动物图片进行精准分类的目的。
-
公开(公告)号:CN106685427A
公开(公告)日:2017-05-17
申请号:CN201611160513.4
申请日:2016-12-15
Applicant: 华南理工大学
IPC: H03M7/30
Abstract: 本发明公开了一种基于信息一致性的稀疏信号重构方法,包括以下步骤:初始化传感器节点i在t时刻的相关参数,计算在t时刻的初始信息向量vi(0)和信息矩阵Vi(0);初始化传感器网络一致性速率因子λ和一致性迭代总次数K,交换网络中相邻节点的信息向量和信息矩阵进行一致性参数的计算;融合信息向量和信息矩阵,进行K次迭代,得到更新后的信息向量vi(K)和信息矩阵Vi(K);用信息向量vi(K)和信息矩阵Vi(K)计算目标传感器节点t时刻的后验状态估计和后验信息矩阵利用和预测下一t+1时刻目标的先验状态估计和先验信息矩阵更新t+1时刻的信息向量vi(t+1)和信息矩阵Vi(t+1);重复以上步骤,完成对目标的状态估计。本发明将伪测量技术融合到分布式卡尔曼滤波算法中,提高了稀疏信号重构的精度。
-
公开(公告)号:CN117911484A
公开(公告)日:2024-04-19
申请号:CN202410082104.5
申请日:2024-01-19
Applicant: 华南理工大学
IPC: G06T7/593 , G06V10/774 , G06V10/40 , G06V10/82
Abstract: 本发明公开了一种通过自监督深度估计的单目BEV感知方法,涉及人工智能技术领域。包括:取某个时刻图像输入第一骨干网络得到高阶图像特征;将一部分图像特征输入上下文信息提取网络进行特征提取;将另一部分图像特征输入深度预测网络进行深度分布预测;自监督深度估计模块将深度分布特征结果转化为3D深度信息;上下文特征结果和3D深度信息外积得到3D体素特征;3D体素特征通过第二骨干网络得到2D BEV特征图;利用2D BEV特征图进行3D感知任务获得感知结果。本发明将单目BEV感知与自监督深度估计巧妙地结合起来,利用自监督深度估计模块来帮助BEV感知任务,从而构建空间位置更加准确的BEV特征图。
-
公开(公告)号:CN109508974B
公开(公告)日:2023-08-22
申请号:CN201811440047.4
申请日:2018-11-29
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于特征融合的购物结账系统,包括:商品识别结账端和云端服务器,所述商品识别结账端包括处理器、商品摄像头、双目摄像头、压力传感器阵列模块、置物台、通信模块、扬声器、声音采集模块和触摸显示屏,所述云端服务器包括商品数据库、交易记录管理模块、结账模块、商品识别模块、人脸识别模块和声纹识别模块;所述置物台的表面贴有压力传感器阵列模块。顾客无需额外将散装商品拿到称重处称重,而是直接拿到商品识别结账系统处进行结账即可,将散装包装商品的结算方式统一化。且本方案能够同时识别所有商品,无需依次放置商品,顾客只需把全部所有商品同时放到台面上,且无论该商品是包装商品还是散装商品,均能统一识别。
-
公开(公告)号:CN109670396B
公开(公告)日:2023-06-27
申请号:CN201811310459.6
申请日:2018-11-06
Applicant: 华南理工大学 , 广州飞宇智能科技有限公司
IPC: G06V40/20 , G06V10/764 , G06T7/246 , G06T7/66 , G08B21/04
Abstract: 本发明公开了一种室内老人跌倒检测方法,旨在为室内的老人异常行为检测并报警提供一种解决方案,包括下述步骤:得到视频数据中的一帧,进行降噪、增强对比度等预处理;计算图像方向梯度直方图特征,并使用SVM分类器实现人体检测,以确定是否包含人体;确定图像包含人体情况下,使用目标跟踪算法跟踪人体区域;以跟踪矩形区域内切椭圆来表征身体特征,内切椭圆中心点和下顶点分别表示人体躯干的中心和脚部,对这两个特征点进行加速度、角度、高度差及停留时间的计算,来判断老人是否跌倒。本发明相较于传统基于加速度传感器或骨骼传感器Kinect的识别方法,具有更低的安装成本,而相较于传统基于人体轮廓长宽比值的判别方法具有更高的识别准确率。
-
公开(公告)号:CN106685427B
公开(公告)日:2019-11-15
申请号:CN201611160513.4
申请日:2016-12-15
Applicant: 华南理工大学
IPC: H03M7/30
Abstract: 本发明公开了一种基于信息一致性的稀疏信号重构方法,包括以下步骤:初始化传感器节点i在t时刻的相关参数,计算在t时刻的的初始信息向量vi(0)和信息矩阵Vi(0);初始化传感器网络一致性速率因子λ和一致性迭代总次数K,交换网络中相邻节点的信息向量和信息矩阵进行一致性参数的计算;融合信息向量和信息矩阵,进行K次迭代,得到更新后的信息向量vi(K)和信息矩阵Vi(K);用信息向量vi(K)和信息矩阵Vi(K)计算目标传感器节点t时刻的后验状态估计和后验信息矩阵利用和预测下一t+1时刻目标的先验状态估计和先验信息矩阵更新t+1时刻的信息向量vi(t+1)和信息矩阵Vi(t+1);重复以上步骤,完成对目标的状态估计。本发明将伪测量技术融合到分布式卡尔曼滤波算法中,提高了稀疏信号重构的精度。
-
公开(公告)号:CN106650813B
公开(公告)日:2019-11-15
申请号:CN201611226528.6
申请日:2016-12-27
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于深度残差网络和LSTM的图像理解方法。所述方法首先构建一个深度残差网络模型提取图像的抽象特征并保存为特征矩阵;然后LSTM模型中的动态注意机制根据特征矩阵动态地生成合适的特征向量,最后LSTM模型根据特征向量生成成自然语言(英语)。本发明利用了深度残差网络在图像特征提取和LSTM对时序序列建模方面的优势,深度残差网络和LSTM模型成了一个编码‑解码框架,将图像内容信息转化成自然语言,达到提取图像的深层次信息的目的。
-
公开(公告)号:CN109522938A
公开(公告)日:2019-03-26
申请号:CN201811255139.5
申请日:2018-10-26
Applicant: 华南理工大学 , 广州飞宇智能科技有限公司
Abstract: 本发明公开了一种基于深度学习的图像中目标的识别方法,步骤如下:输入一张图像,使用卷积神经网络进行候选区域的提取,对输出的候选区域进行过滤优化操作,同时对每个候选区域进行归一化处理,将候选区域输入卷积神经网络进行特征提取,使用训练好的分类回归网络进行目标图像的分类和定位和检测,最后对选取的目标区域进行边框回归操作以修正目标区域的位置。本方法采用卷积神经网络来对图像中可能包含目标的区域进行提取,减少了候选目标区的数量,同时对卷积神经网路的输出目标候选区域执行优化过滤操作,提高了算法的计算速度。另外,对目标检测的候选区域采用多样的长宽比例和区域大小,更贴近现实场景,提高了算法的鲁棒性。
-
公开(公告)号:CN109508974A
公开(公告)日:2019-03-22
申请号:CN201811440047.4
申请日:2018-11-29
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于特征融合的购物结账系统,包括:商品识别结账端和云端服务器,所述商品识别结账端包括处理器、商品摄像头、双目摄像头、压力传感器阵列模块、置物台、通信模块、扬声器、声音采集模块和触摸显示屏,所述云端服务器包括商品数据库、交易记录管理模块、结账模块、商品识别模块、人脸识别模块和声纹识别模块;所述置物台的表面贴有压力传感器阵列模块。顾客无需额外将散装商品拿到称重处称重,而是直接拿到商品识别结账系统处进行结账即可,将散装包装商品的结算方式统一化。且本方案能够同时识别所有商品,无需依次放置商品,顾客只需把全部所有商品同时放到台面上,且无论该商品是包装商品还是散装商品,均能统一识别。
-
-
-
-
-
-
-
-
-