-
公开(公告)号:CN115909418B
公开(公告)日:2023-07-25
申请号:CN202310180797.7
申请日:2023-03-01
Applicant: 科大讯飞股份有限公司
IPC: G06V40/10 , G06V10/80 , G06V10/82 , G06V20/70 , G06V10/26 , G06V10/764 , G06N3/0464 , G06N3/048 , G06N3/08 , G06F3/01
Abstract: 本申请公开了一种人体指向确定、屏幕控制方法、装置及相关设备,本申请同时获取对人体拍摄的目标图像以及深度点云数据,提取目标图像的人体掩码特征,以及提取深度点云数据的深度点云特征,基于人体掩码特征对深度点云特征进行处理,得到深度补全特征,基于深度补全特征确定人体指向点信息。本申请在传统的基于人体深度点云数据进行人体指向估计的基础上,额外考虑了对人体拍摄的目标图像,利用该目标图像的人体掩码特征对深度点云特征进行处理,得到的深度补全特征相比于单纯从深度点云数据中提取的深度点云特征,其包含的信息更加丰富,进而可以更加准确的估计人体指向点信息,提升了人体指向点信息的准确性。
-
公开(公告)号:CN115909418A
公开(公告)日:2023-04-04
申请号:CN202310180797.7
申请日:2023-03-01
Applicant: 科大讯飞股份有限公司
IPC: G06V40/10 , G06V10/80 , G06V10/82 , G06V20/70 , G06V10/26 , G06V10/764 , G06N3/0464 , G06N3/048 , G06N3/08 , G06F3/01
Abstract: 本申请公开了一种人体指向确定、屏幕控制方法、装置及相关设备,本申请同时获取对人体拍摄的目标图像以及深度点云数据,提取目标图像的人体掩码特征,以及提取深度点云数据的深度点云特征,基于人体掩码特征对深度点云特征进行处理,得到深度补全特征,基于深度补全特征确定人体指向点信息。本申请在传统的基于人体深度点云数据进行人体指向估计的基础上,额外考虑了对人体拍摄的目标图像,利用该目标图像的人体掩码特征对深度点云特征进行处理,得到的深度补全特征相比于单纯从深度点云数据中提取的深度点云特征,其包含的信息更加丰富,进而可以更加准确的估计人体指向点信息,提升了人体指向点信息的准确性。
-
公开(公告)号:CN119762867A
公开(公告)日:2025-04-04
申请号:CN202411880869.X
申请日:2024-12-19
Applicant: 科大讯飞股份有限公司
IPC: G06V10/764 , G06V10/774 , G06V10/82 , G06V10/80 , G06N3/0464 , G06V10/766
Abstract: 本申请公开了一种目标检测方法、装置、存储介质及设备,该方法包括:首先获取边缘设备所处场景的环境图像作为待检测的目标图像;然后将目标图像输入预先构建的目标检测模型,预测得到目标图像中各个目标物体的分类结果和位置信息以及像素级别的分类结果;接着对各个目标物体的分类结果和位置信息以及像素级别的分类结果进行融合处理,得到目标图像中目标物体的检测结果。由于本申请是先基于CLIP模型和特征编码网络,利用样本图像进行训练构建了目标检测模型,使得该模型能够学习到CLIP模型的图像表征能力,从而在边缘设备中利用该模型对目标图像中的目标物体进行检测时,可以有效提高检测结果的准确率和稳定性,进而提高了边缘设备的目标检测效果。
-
公开(公告)号:CN119845246A
公开(公告)日:2025-04-18
申请号:CN202411753645.2
申请日:2024-12-02
Applicant: 科大讯飞股份有限公司
IPC: G01C21/00
Abstract: 本申请公开了一种机器人建图方法及相关装置、机器人和存储介质,其中,机器人建图方法包括:获取机器人在当前点位处的拍摄图像和雷达数据;其中,雷达数据包括若干测点数据;对齐拍摄图像与雷达数据,并识别拍摄图像中各个对象的图像区域;基于雷达数据中分别与各个对象的图像区域相对齐的测点数据,确定各个对象分别在栅格地图中占据的目标栅格;响应于各个对象中存在遮挡物,至少基于当前点位和遮挡物在栅格地图中占据的目标栅格,确定被遮挡物遮挡的待探索区域,并基于待探索区域,确定机器人待行至的探索点位。上述方案,能够提升机器人建图精度。
-
公开(公告)号:CN118155014A
公开(公告)日:2024-06-07
申请号:CN202410294266.5
申请日:2024-03-14
Applicant: 科大讯飞股份有限公司
IPC: G06V10/774 , G06V10/778 , G06V10/40 , G06V10/26 , G06V10/764 , G06V10/82
Abstract: 本发明提供一种视觉感知、模型训练方法、装置、设备和存储介质,其中视觉感知方法包括:获取待感知图像;基于视觉感知模型,对待感知图像进行视觉感知;视觉感知模型基于学生模型确定,学生模型基于第一样本图像和伪视觉标签训练得到;伪视觉标签基于教师模型对第一样本图像进行视觉感知得到;教师模型基于预先标记的第二样本图像训练得到。本发明提供的方法、装置、设备和存储介质,大大缓解了视觉感知模型训练对于标记样本的依赖性,降低了视觉感知模型的训练成本,保证了视觉感知模型的鲁棒性和泛化能力,基于由此得到的视觉感知模型针对待感知图像进行视觉感知,能够保证视觉感知的可靠性和稳定性,有效提升视觉感知性能。
-
-
-
-