-
公开(公告)号:CN118071994B
公开(公告)日:2024-08-27
申请号:CN202410213038.0
申请日:2024-02-27
Applicant: 数据堂(北京)科技股份有限公司 , 河北数云堂智能科技有限公司
IPC: G06V10/25 , G06V20/70 , G06V20/64 , G06V10/762
Abstract: 本发明提供了自动驾驶场景下不完整点云数据标注方法、装置及终端,属于点云数据标注技术领域,本方法包括利用启动标注模块在点云数据内进行范围框选,形成启动三维矩形框;对启动三维矩形框的点云进行过滤,然后再进行聚类,形成多个簇,选取待标注目标簇,然后利用预设规则生成外接三维矩形框;计算凸包边界,自动矫正外接三维矩形框,使之与目标朝向保持一致,构建最小矩形框;推理最小矩形框的生长方向,确定生长距离,以此自动补全最小矩形框,形成完整的待标注目标矩形框。本发明能够帮助标注人员快速准确完成不完整目标的完整目标框自动标注,提高工作效率。本发明可以适应多种不同类型的目标。
-
公开(公告)号:CN117830438A
公开(公告)日:2024-04-05
申请号:CN202410239833.7
申请日:2024-03-04
Applicant: 数据堂(北京)科技股份有限公司 , 河北数云堂智能科技有限公司
Abstract: 本发明提供了一种基于特定标志物的激光雷达与相机联合标定方法,属于点云数据处理技术领域,包括利用棋盘格标定板,标定相机内参;将标志物摆放到三脚架上,标志物充满相机整个视野,三脚架高度互不相同,以相机为参考,满足相机的远近高低处都有标志物,录制标定数据包;解析标定数据包,获取相机和雷达数据;在相机和雷达数据中,选取距离各个标志物中心最近的2D点和3D点,组成数据对,然后拷贝坐标值到文件中保存,实现雷达和相机之间的空间对应关系的准确建立;输入到slovepnp函数中,进行外参的求解;进行外参准确性的验证。本方法能够低成本、高效率准确建立雷达和相机之间的空间对应关系,为多传感器数据融合提供可靠基础。
-
公开(公告)号:CN120030132A
公开(公告)日:2025-05-23
申请号:CN202510510268.8
申请日:2025-04-23
Applicant: 数据堂(北京)科技股份有限公司
IPC: G06F16/3329 , G06F40/205 , G06F40/30
Abstract: 本申请涉及智能问答技术领域,其具体地公开了一种基于多模态大模型的问答数据处理方法及系统,其采用基于深度学习的多模态数据处理技术对用户输入的文本问题和图像模态上下文进行语义解析,分别提取出文本问题和图像模态上下文的语义特征,接着对两者进行线性投影以实现特征对齐,并引入跨模态特征全域关联交互机制,挖掘文本问题与图像模态上下文之间的深层次语义关联,实现对文本问题和图像模态上下文信息的有效融合,进而利用大语言模型的推理能力,生成与文本问题相关的文本答案。通过这种方式,能够显著提高问答系统对多模态信息的理解和处理能力,生成与文本问题紧密相关且逻辑完整的文本答案,满足用户对于多模态问答场景下的信息需求。
-
公开(公告)号:CN119380144B
公开(公告)日:2025-04-04
申请号:CN202411946438.9
申请日:2024-12-27
Applicant: 数据堂(北京)科技股份有限公司
IPC: G06V10/774 , G06V20/70 , G06V30/19 , G06V10/82 , G06N3/0464
Abstract: 本申请涉及计算机技术领域,其具体地公开了一种多模态大模型训练数据采集方法及系统,其采用基于深度学习的数据处理技术对语义对齐的图像数据和图像内容文本描述数据进行语义特征提取和跨模态联合编码,以捕捉到模态间的语义关联,实现跨模态的语义信息融合,并在此基础上进一步进行图像样本的生成,进而,通过对生成的图像样本与原始图像数据进行语义偏移度量,以智能识别生成的图像样本是否为合格增强样本。通过这种方式,可以有效地丰富多模态训练数据集,确保数据的质量,解决多模态数据增强过程中跨模态语义一致性的问题,从而提高多模态大模型的训练效率。
-
公开(公告)号:CN118071994A
公开(公告)日:2024-05-24
申请号:CN202410213038.0
申请日:2024-02-27
Applicant: 数据堂(北京)科技股份有限公司 , 河北数云堂智能科技有限公司
IPC: G06V10/25 , G06V20/70 , G06V20/64 , G06V10/762
Abstract: 本发明提供了自动驾驶场景下不完整点云数据标注方法、装置及终端,属于点云数据标注技术领域,本方法包括利用启动标注模块在点云数据内进行范围框选,形成启动三维矩形框;对启动三维矩形框的点云进行过滤,然后再进行聚类,形成多个簇,选取待标注目标簇,然后利用预设规则生成外接三维矩形框;计算凸包边界,自动矫正外接三维矩形框,使之与目标朝向保持一致,构建最小矩形框;推理最小矩形框的生长方向,确定生长距离,以此自动补全最小矩形框,形成完整的待标注目标矩形框。本发明能够帮助标注人员快速准确完成不完整目标的完整目标框自动标注,提高工作效率。本发明可以适应多种不同类型的目标。
-
公开(公告)号:CN119888739A
公开(公告)日:2025-04-25
申请号:CN202510354273.4
申请日:2025-03-25
Applicant: 数据堂(北京)科技股份有限公司 , 河北数云堂智能科技有限公司
Abstract: 本发明属于点云数据处理技术领域,具体涉及一种多帧点云目标检测与分割融合标注方法、装置及终端。所述方法包括:进行目标检测,并将目标检测转化为分割数据;进行叠帧渲染处理,得到渲染后的4D点云数据;针对4D点云数据进行叠帧分割处理;存储分割标注结果并进行渲染。本发明一次性实现了点云数据的分割标注,避免重复调整步骤,并且提高了分割效率,并为后续的数据分析和处理提供了高质量的输入,确保了动态场景下的目标提取与分析的准确性和流畅性。另外,确保了即使在大量数据下,渲染过程依旧能够保持高效和低延迟。
-
公开(公告)号:CN119380341A
公开(公告)日:2025-01-28
申请号:CN202411946533.9
申请日:2024-12-27
Applicant: 数据堂(北京)科技股份有限公司
IPC: G06V20/70 , G06V30/19 , G06V10/82 , G06N3/0464
Abstract: 本申请公开了一种大模型多模态数据语义表征对齐方法,其通过采用基于深度学习的数据处理技术对第一模态数据和第二模态数据分别进行细粒度局部特征提取,并计算所述第一模态数据和第二模态数据的细粒度局部特征之间的相似度,作为初对齐损失函数值,接着,进一步结合全局上下文语义信息,对所述第一模态数据和第二模态数据的细粒度局部特征进行语义强化编码,通过上下文级别的语义对齐度量得到精对齐损失函数值,进而,基于精对齐损失函数值和初对齐损失函数值来指导模型训练,以实现多模态数据的语义表征对齐。通过这种方式,可以显著提高多模态数据在语义层面的对齐精度,为后续的数据融合和应用提供更准确的特征基础。
-
公开(公告)号:CN119380144A
公开(公告)日:2025-01-28
申请号:CN202411946438.9
申请日:2024-12-27
Applicant: 数据堂(北京)科技股份有限公司
IPC: G06V10/774 , G06V20/70 , G06V30/19 , G06V10/82 , G06N3/0464
Abstract: 本申请涉及计算机技术领域,其具体地公开了一种多模态大模型训练数据采集方法及系统,其采用基于深度学习的数据处理技术对语义对齐的图像数据和图像内容文本描述数据进行语义特征提取和跨模态联合编码,以捕捉到模态间的语义关联,实现跨模态的语义信息融合,并在此基础上进一步进行图像样本的生成,进而,通过对生成的图像样本与原始图像数据进行语义偏移度量,以智能识别生成的图像样本是否为合格增强样本。通过这种方式,可以有效地丰富多模态训练数据集,确保数据的质量,解决多模态数据增强过程中跨模态语义一致性的问题,从而提高多模态大模型的训练效率。
-
公开(公告)号:CN119377625A
公开(公告)日:2025-01-28
申请号:CN202411946980.4
申请日:2024-12-27
Applicant: 数据堂(北京)科技股份有限公司
IPC: G06F18/21 , G06F18/25 , G06N3/0442 , G06F18/10
Abstract: 本申请公开了一种多维度的大模型数据质量评测方法及系统,其在提取出满足最低内在质量要求的数据集和参考数据集中的各个数据特征之后,基于数据集中各个数据样本之间的信息场效应,对各个数据样本进行特征更新和上下文语义关联强化处理,从而提高各个数据样本的语义特征表达能力,实现更为准确的数据质量评估。这样,通过引入数据集的上下文关联信息,能够更准确地理解各个数据样本的语义信息,进而提升整体数据质量评估的准确性。
-
-
-
-
-
-
-
-