-
公开(公告)号:CN119763142A
公开(公告)日:2025-04-04
申请号:CN202411611497.0
申请日:2024-11-12
Applicant: 北京邮电大学 , 国网湖北省电力有限公司信息通信公司
Inventor: 孙华梅 , 周正 , 尹建芹 , 胡莉娜 , 徐宁 , 汤弋 , 叶露 , 孙俊 , 陈璞 , 周德坤 , 张曦 , 朱兆宇 , 柯宏宇 , 代静 , 周亮 , 舒蔚君 , 曾言 , 刘小丽 , 郭文凯
IPC: G06V30/422 , G06V10/82 , G06V30/19 , G06V30/14 , G06V10/26 , G06V10/74 , G06V10/80 , G06V10/44 , G06N3/0464 , G06N3/08
Abstract: 本申请提出了一种面向机器人服务的CAD图纸智能分析方法,包括:获取原始图元数据集;对原始图元数据集中的图元图像进行文本检测,获得文本检测结果,包括文本位置和文本标签;基于文本检测结果对原始图元数据集中的图元图像进行预处理,并对预处理后的图像进行图元检测,得到图像检测结果,包括图像位置和图元图像;基于文本位置和图像位置将文本标签和图元图像进行配对,并进一步构建图元数据集;对图元数据集中的图元图像进行数据增强,并进一步对目标检测模型进行训练,得到训练后的目标检测模型;对待检测的图元图像进行数据增强,并输入训练后的目标检测模型中,输出图元检测结果。采用上述方案的本发明具有较强的图元识别能力。
-
公开(公告)号:CN118811189A
公开(公告)日:2024-10-22
申请号:CN202411111718.8
申请日:2024-08-14
Applicant: 北京邮电大学
Abstract: 本发明公开了一种基于大语言模型和深度学习的多模式软体手抓取方法及系统,方法包括:S1,利用深度相机拍摄RGB图片与深度图片;S2,将RGB图片作为输入,使用Yolo模型识别并分割图片中的物体,输出物体名称与其在图中的二维坐标;S3,将S2的输出与指令作为输入,使用GPT4判断应当抓取的物体名称,输出对应的二维坐标;S4,利用获得的二维坐标分割RGB图像与深度图像,获得待抓取对象的分割图;S5,提取RGB图像中物体二维形状特征与深度图像中深度特征,通过SVM分类模型判断物体形状;S6,将判断出的形状与抓取方式建立对应关系,最终得到抓取方式。本发明能够实现高准确率的实时物体识别和操作决策。
-