-
公开(公告)号:CN112991379A
公开(公告)日:2021-06-18
申请号:CN202110382965.1
申请日:2021-04-09
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于动态视觉的无人售货方法及系统,属于人工智能技术领域,包括:检测无人售货柜门的状态;对用户的手部进行生物识别;判断手部相对于无人售货柜门的运动方向;根据所述运动方向、所述临时商品列表信息以及所述更新后的临时购物车信息判定购物状态;得到最终购物结果并完成购物,本发明提高了识别商品的准确性、降低了货损率并提升了购物体验。
-
公开(公告)号:CN117911484A
公开(公告)日:2024-04-19
申请号:CN202410082104.5
申请日:2024-01-19
Applicant: 华南理工大学
IPC: G06T7/593 , G06V10/774 , G06V10/40 , G06V10/82
Abstract: 本发明公开了一种通过自监督深度估计的单目BEV感知方法,涉及人工智能技术领域。包括:取某个时刻图像输入第一骨干网络得到高阶图像特征;将一部分图像特征输入上下文信息提取网络进行特征提取;将另一部分图像特征输入深度预测网络进行深度分布预测;自监督深度估计模块将深度分布特征结果转化为3D深度信息;上下文特征结果和3D深度信息外积得到3D体素特征;3D体素特征通过第二骨干网络得到2D BEV特征图;利用2D BEV特征图进行3D感知任务获得感知结果。本发明将单目BEV感知与自监督深度估计巧妙地结合起来,利用自监督深度估计模块来帮助BEV感知任务,从而构建空间位置更加准确的BEV特征图。
-
公开(公告)号:CN112991379B
公开(公告)日:2024-02-09
申请号:CN202110382965.1
申请日:2021-04-09
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于动态视觉的无人售货方法及系统,属于人工智能技术领域,包括:检测无人售货柜门的状态;对用户的手部进行生物识别;判断手部相对于无人售货柜门的运动方向;根据所述运动方向、所述临时商品列表信息以及所述更新后的临时购物车信息判定购物状态;得到最终购物结果并完成购物,本发明提高了识别商品的准确性、降低了货损率并提升了购物体验。
-
公开(公告)号:CN114721673B
公开(公告)日:2025-03-07
申请号:CN202210403130.4
申请日:2022-04-18
Applicant: 华南理工大学
IPC: G06F8/60 , G06N3/045 , G06N3/0464 , G06N3/082 , G06N5/04
Abstract: 本发明公开了一种用于智能无人售货系统的嵌入式部署方法及系统,涉及嵌入式部署技术领域。具体步骤包括如下:构建并训练好无人售货系统的检测和追踪模型;对所述检测和追踪模型进行剪枝操作,得到第一模型;对所述第一模型进行量化操作,得到第二模型;将所述第二模型转化为嵌入式设备可识别的中间文件;对所述中间文件进行模型推理,将无人售货系统部署到嵌入式设备。本方法提出将智能无人售货系统的模型进行优化,使其能够部署到嵌入式设备上,实现本地化的分析计算,避免了将图像或视频数据传输到云端服务器的操作,解决了传统方案容易产生处理时延的问题,保证系统的实时性。
-
公开(公告)号:CN118982869A
公开(公告)日:2024-11-19
申请号:CN202411069987.2
申请日:2024-08-06
Applicant: 华南理工大学
IPC: G06V40/20 , G06V20/40 , G06V10/764 , G06V10/77 , G06V10/52 , G06V10/44 , G06V10/62 , G06V10/82 , G06V10/774 , G06N3/0895 , G06N3/0455 , G06N3/0464 , G06N3/048 , G06N3/047
Abstract: 本发明公开了基于Soft‑Teacher的半监督学习视频行为识别方法,涉及视频处理技术领域。获取视频样本数据,将视频样本数据划分为有标签数据和无标签数据;将有标签数据和无标签数据输入至训练好的视频行为识别模型中,得到最终视频行为类别的分类结果。本发明依赖少量标注数据以及大部分标注数据进行训练的方法,降低了视频数据标注任务的工作量;针对Transformer的丢失空间偏置问题,引入局部特征学习模块,同时为了更好地利用整个序列的数据,引入了序列池化技术来优化预测值。
-
公开(公告)号:CN114582002B
公开(公告)日:2024-07-09
申请号:CN202210403298.5
申请日:2022-04-18
Applicant: 华南理工大学
IPC: G06V40/16 , G06N3/045 , G06N3/0464 , G06N3/08 , G06V10/82
Abstract: 本发明公开了一种结合注意力模块与二阶池化机制的人脸表情识别方法,涉及深度学习领域。本发明包括以下步骤:获取人脸图像;对人脸图像预处理,所述人脸图像预处理包括人脸检测与对齐,数据增强以及图像归一化;将预处理后的人脸图像进行特征提取,并完成表情分类。本发明有效地将自然环境下受光照、头部姿态、遮挡等因素干扰的人脸图片转为对比度合适、无遮挡的正脸图片,从而解决了真实世界环境下其他与表情无关因素变量对表情识别效果带来的干扰问题。
-
公开(公告)号:CN114721673A
公开(公告)日:2022-07-08
申请号:CN202210403130.4
申请日:2022-04-18
Applicant: 华南理工大学
Abstract: 本发明公开了一种用于智能无人售货系统的嵌入式部署方法及系统,涉及嵌入式部署技术领域。具体步骤包括如下:构建并训练好无人售货系统的检测和追踪模型;对所述检测和追踪模型进行剪枝操作,得到第一模型;对所述第一模型进行量化操作,得到第二模型;将所述第二模型转化为嵌入式设备可识别的中间文件;对所述中间文件进行模型推理,将无人售货系统部署到嵌入式设备。本方法提出将智能无人售货系统的模型进行优化,使其能够部署到嵌入式设备上,实现本地化的分析计算,避免了将图像或视频数据传输到云端服务器的操作,解决了传统方案容易产生处理时延的问题,保证系统的实时性。
-
公开(公告)号:CN114582002A
公开(公告)日:2022-06-03
申请号:CN202210403298.5
申请日:2022-04-18
Applicant: 华南理工大学
Abstract: 本发明公开了一种结合注意力模块与二阶池化机制的人脸表情识别方法,涉及深度学习领域。本发明包括以下步骤:获取人脸图像;对人脸图像预处理,所述人脸图像预处理包括人脸检测与对齐,数据增强以及图像归一化;将预处理后的人脸图像进行特征提取,并完成表情分类。本发明有效地将自然环境下受光照、头部姿态、遮挡等因素干扰的人脸图片转为对比度合适、无遮挡的正脸图片,从而解决了真实世界环境下其他与表情无关因素变量对表情识别效果带来的干扰问题。
-
-
-
-
-
-
-