基于迭代推理的光学遥感图像标注引擎构建方法及装置

    公开(公告)号:CN119152506A

    公开(公告)日:2024-12-17

    申请号:CN202411649679.7

    申请日:2024-11-19

    Abstract: 本发明公开了一种基于迭代推理的光学遥感图像标注引擎构建方法及装置;本方法可以作为光学遥感图像训练样本人工标注方法的一种补充,降低光学遥感图像训练数据的标注成本和难度。本方法面向多模态大模型的训练作业场景,旨在基于海量的真实光学遥感图像生成多粒度多模态的合成标注数据集,从而支撑多模态大模型在图像分类、图像描述、图像问答、图像区域分类、图像区域描述、图像区域问答、目标检测、Vision Grounding、目标掩膜提取、实例分割、引用表达分割等多种光学遥感图像解译任务上的训练。本发明使单一模型具备处理各种空间层次结构和语义粒度的能力。

    一种机械臂实时轨迹重规划方法
    2.
    发明公开

    公开(公告)号:CN117718966A

    公开(公告)日:2024-03-19

    申请号:CN202410032990.0

    申请日:2024-01-08

    Abstract: 本说明书公开了一种机械臂实时轨迹重规划方法,可以确定机械臂在执行目标任务时的环境信息,可以根据环境信息,通过全局路径规划器规划出无碰撞的安全运动路径,以得到初始路径,在通过初始路径实时控制机械臂执行所述目标任务时实时检测环境信息,若通过实时检测出的环境信息确定存在障碍物对机械臂存在干扰,通过局部路径规划器在初始路径中确定局部起始点和局部终止点,以最小化每个待求解的路径点对应的势场、与局部终止点之间的距离和引起的路径偏转角为优化目标,并结合粒子群算法,重新规划出局部路径,并通过该局部路径对初始路径进行更新,以对机械臂进行控制,从而提高了对路径/轨迹进行重新规划的准确性。

    一种基于votenet模型的三维目标检测方法和系统

    公开(公告)号:CN115880685B

    公开(公告)日:2024-02-13

    申请号:CN202211577601.X

    申请日:2022-12-09

    Abstract: 一种基于votenet模型的三维目标检测方法,包括:构建votenet模型;针对感兴趣目标构建用于训练votenet模型的点云数据集;构建用于训练votenet模型的基于双层嵌套三维矩形框空间划分的种子点位移损失函数;基于votenet模型原方法构建用于训练votenet模型的其他损失函数,包括前景背景分类损失函数、中心偏移量损失函数、尺寸偏移量损失函数以及朝向角偏移量损失函数;基于构建的点云数据集和损失函数训练votenet模型;使用RGB‑D相机获取待检测场景的点云数据;基于待检测场景的点云数据,经过votenet模型,输出感兴趣目标的三维目标检测结果。本发明可以在不增加模型推理延时的前提下,有效降低三维目标检测结果的虚警率。

    基于天基遥感模型的遥感图像处理方法、系统、电子设备、介质

    公开(公告)号:CN119152373A

    公开(公告)日:2024-12-17

    申请号:CN202411595306.6

    申请日:2024-11-11

    Abstract: 本发明公开了一种基于天基遥感模型的遥感图像处理方法、系统、电子设备、介质,包括:获取遥感图像数据,并标注;针对遥感图像处理任务设置任务描述指令,设计提示词模板,将任务描述指令填入提示词模板中再输入至大语言模型,实现对任务描述指令的扩展,得到任务描述指令集;针对遥感图像处理任务设置输出形式指令,将输出形式指令填入提示词模板中再输入至大语言模型,实现对输出形式指令的扩展,得到输出形式指令集;基于标注后的遥感图像数据、任务描述指令集、输出形式指令集构建多模态对话数据集;利用多模态对话数据集训练天基遥感模型;训练好的天基遥感模型用于根据输入的待处理遥感图像、任务描述指令、输出形式指令,输出回答。

    一种夹取任务的执行方法、装置、存储介质及电子设备

    公开(公告)号:CN117226854A

    公开(公告)日:2023-12-15

    申请号:CN202311505956.2

    申请日:2023-11-13

    Abstract: 本说明书公开了一种夹取任务的执行方法、装置、存储介质及电子设备。所述方法包括:获取包含有目标物的图像数据,并确定目标物对应的轮廓信息以及目标物所处环境的环境信息;根据轮廓信息,确定目标物中包含的每个部件所对应的位姿信息、形体信息以及语义信息;根据环境信息、位姿信息、形体信息、语义信息以及每种夹取姿态对应的预设夹取姿态信息,确定通过不同夹取姿态夹取目标物中每种部件时的夹取损失值;根据夹取损失值,在各夹取姿态中确定出目标夹取姿态,以及在目标物的各部件中确定出目标部件,并按照目标夹取姿态执行针对目标部件的夹取任务。

    基于迭代推理的光学遥感图像标注引擎构建方法及装置

    公开(公告)号:CN119152506B

    公开(公告)日:2025-02-14

    申请号:CN202411649679.7

    申请日:2024-11-19

    Abstract: 本发明公开了一种基于迭代推理的光学遥感图像标注引擎构建方法及装置;本方法可以作为光学遥感图像训练样本人工标注方法的一种补充,降低光学遥感图像训练数据的标注成本和难度。本方法面向多模态大模型的训练作业场景,旨在基于海量的真实光学遥感图像生成多粒度多模态的合成标注数据集,从而支撑多模态大模型在图像分类、图像描述、图像问答、图像区域分类、图像区域描述、图像区域问答、目标检测、Vision Grounding、目标掩膜提取、实例分割、引用表达分割等多种光学遥感图像解译任务上的训练。本发明使单一模型具备处理各种空间层次结构和语义粒度的能力。

    标注数据评分方法及基于其的假阳性标注数据识别方法

    公开(公告)号:CN119942315A

    公开(公告)日:2025-05-06

    申请号:CN202510412530.5

    申请日:2025-04-02

    Abstract: 本申请涉及数据处理技术领域,公开了一种标注数据评分方法及基于其的假阳性标注数据识别方法,其中,评分方法包括:获取包含目标对象的目标图像;重复构建基于目标类别名称和干扰类别名称集合的选择题,并将选择题与目标图像输入到至少一个视觉语言模型进行问答;重复从预先配置的判断题模板池中生成基于目标类别名称和目标图像的判断题,并将判断题与目标图像输入到至少一个视觉语言模型进行问答;基于选择答案正确次数和判断答案正确次数,确定所有视觉语言模型的平均评分,并将平均评分作为目标图像中目标框标注数据对应的目标评分。本申请提供的技术方案,能够提升标注数据评分的准确性,确保评估结果的全面性与精确性。

    一种夹取任务的执行方法、装置、存储介质及电子设备

    公开(公告)号:CN117226854B

    公开(公告)日:2024-02-02

    申请号:CN202311505956.2

    申请日:2023-11-13

    Abstract: 本说明书公开了一种夹取任务的执行方法、装置、存储介质及电子设备。所述方法包括:获取包含有目标物的图像数据,并确定目标物对应的轮廓信息以及目标物所处环境的环境信息;根据轮廓信息,确定目标物中包含的每个部件所对应的位姿信息、形体信息以及语义信息;根据环境信息、位姿信息、形体信息、语义信息以及每种夹取姿态对应的预设夹取姿态信息,确定通过不同夹取姿态夹取目标物中每种部件时的夹取损失值;根据夹取损失值,在各夹取姿态中确定出目标夹取姿态,以及在目标物的各部件中确定出目标部件,并按照目标夹取姿态执行针对目标部件的夹取任务。

    一种基于votenet模型的三维目标检测方法和系统

    公开(公告)号:CN115880685A

    公开(公告)日:2023-03-31

    申请号:CN202211577601.X

    申请日:2022-12-09

    Abstract: 一种基于votenet模型的三维目标检测方法,包括:构建votenet模型;针对感兴趣目标构建用于训练votenet模型的点云数据集;构建用于训练votenet模型的基于双层嵌套三维矩形框空间划分的种子点位移损失函数;基于votenet模型原方法构建用于训练votenet模型的其他损失函数,包括前景背景分类损失函数、中心偏移量损失函数、尺寸偏移量损失函数以及朝向角偏移量损失函数;基于构建的点云数据集和损失函数训练votenet模型;使用RGB‑D相机获取待检测场景的点云数据;基于待检测场景的点云数据,经过votenet模型,输出感兴趣目标的三维目标检测结果。本发明可以在不增加模型推理延时的前提下,有效降低三维目标检测结果的虚警率。

Patent Agency Ranking