-
公开(公告)号:CN118470079A
公开(公告)日:2024-08-09
申请号:CN202310100361.2
申请日:2023-02-07
Applicant: 富士通株式会社
Abstract: 本申请实施例提供一种单目深度估计装置和方法以及电子设备。所述单目深度估计装置包括:编码器,其用于对输入图像进行编码处理,获得至少两个具有不同尺寸的特征;解码器,其用于对至少一个特征进行基于注意力机制的处理,以获得表示所述特征中不同像素单元之间的相关性信息的相关性特征,并基于所述相关性特征和所述至少两个特征进行融合处理;以及深度图像生成部,其基于所述融合处理的结果生成深度图像。本申请对编码器获得的特征进行基于注意力机制的处理,以获得体现图像全局信息的相关性特征,将该相关性特征与图像的特征进行融合,从而生成深度图像,由此,能够提高深度图像的准确性。
-
公开(公告)号:CN117115434A
公开(公告)日:2023-11-24
申请号:CN202210512475.3
申请日:2022-05-12
Applicant: 富士通株式会社
IPC: G06V10/26 , G06V10/764 , G06V10/774 , G06V10/82 , G06V10/44 , G06V10/25 , G06N3/0464 , G06N3/08 , G06T7/80
Abstract: 本申请提供一种数据分割装置和方法,获取与二维图像数据对应的三维点云数据的第一坐标,并且对该第一坐标进行坐标变换得到三维点云数据的第二坐标;对二维图像数据进行分割;进而确定该第二坐标与二维图像数据的第三坐标是否匹配,在匹配的情况下,基于二维图像数据的分割结果进一步分割三维点云数据。由此,能够在不采用大规模的传感设备、也不需要较大数据集训练模型的前提下,进行更加准确、便捷的三维点云数据的分割,进一步提高三维点云数据的分割准确性。
-
公开(公告)号:CN119851195A
公开(公告)日:2025-04-18
申请号:CN202311340361.6
申请日:2023-10-16
Applicant: 富士通株式会社
Abstract: 本申请实施例提供一种货品状态检测装置及方法,该装置包括:第一检测单元,其从第一图像中提取边缘特征,生成第一边缘特征图像,从第二图像中提取边缘特征,生成第二边缘特征图像;第一确定单元,其计算所述第二边缘特征图像与所述第一边缘特征图像的第一差值图像,根据所述第一差值图像确定货品状态变化区域;第二确定单元,其确定所述货品状态变化区域中货品状态变化类型。
-
公开(公告)号:CN119851193A
公开(公告)日:2025-04-18
申请号:CN202311338509.2
申请日:2023-10-16
Applicant: 富士通株式会社
IPC: G06V20/52 , G06V10/22 , G06V10/764
Abstract: 本申请实施例提供一种货架检测装置及方法,该装置包括:第一检测单元,其从输入图像中检测并识别出多个货品在所述输入图像中的位置;第一确定单元,其确定每个货品的预定位置的信息,并对所述每个货品的预定位置的信息进行分类;第二确定单元,其对每个类别内的货品的预定位置的信息进行拟合,将每个类别内拟合得到的直线确定为货架层的位置。
-
公开(公告)号:CN118628549A
公开(公告)日:2024-09-10
申请号:CN202310219866.0
申请日:2023-03-07
Applicant: 富士通株式会社
IPC: G06T7/50 , G06N3/0442
Abstract: 本申请实施例提供一种单目深度估计装置和方法以及电子设备。所述单目深度估计装置包括:编码器,其用于对输入图像进行编码处理,获得至少两个具有不同尺寸的特征;解码器,其用于对至少一个特征进行基于门控注意力机制的处理,以获得表示所述特征中不同像素单元之间的相关性信息的全局性特征,并基于所述全局性特征和所述至少两个特征进行融合处理;以及深度图像生成部,其基于所述融合处理的结果生成深度图像。本申请对编码器获得的特征进行基于门控注意力机制的处理,以获得体现图像全局信息的全局性特征,将该全局性特征与图像的特征进行融合,从而生成深度图像,由此,能够提高深度图像的准确性。
-
-
-
-