-
公开(公告)号:CN112861590A
公开(公告)日:2021-05-28
申请号:CN201911189799.2
申请日:2019-11-28
Applicant: 富士通株式会社
Abstract: 公开了一种信息处理装置和方法以及图像识别设备。该信息处理装置包括:模板生成单元,被配置成生成针对多个不同面部姿态的多个2D面部关键点模板;模板选择单元,被配置成根据从输入图像检测到的面部图像中的面部姿态和/或关键点的位置,从多个2D面部关键点模板中选择用于所检测到的面部图像的2D面部关键点模板;以及图像剪切单元,被配置成至少根据所检测到的面部图像中的关键点的位置和所选择的2D面部关键点模板,从输入图像剪切出与所检测到的面部图像对应的剪切图像。
-
公开(公告)号:CN106558076B
公开(公告)日:2019-06-18
申请号:CN201510590009.7
申请日:2015-09-16
Applicant: 富士通株式会社
Abstract: 本发明公开了一种三维重建对象的方法和设备。该方法包括:获得三维空间中体素的初始局部TSDF值,每个初始局部TSDF值对应于多个深度图中的一个深度图;按对应的深度图,将初始局部TSDF值分组,至少一组初始局部TSDF值对应于不止一个深度图;针对每组初始局部TSDF值,得到该组的全局TSDF值;将所得到的各组的全局TSDF值作为初始局部TSDF值,求解最优化问题,以得到最终全局TSDF值;以及基于所得到的最终全局TSDF值,三维重建所述对象;其中,在所述最优化问题中,变量是体素的全局TSDF值和变换的参数,代价函数与下列因素相关:特定体素的全局TSDF值与该体素经变换对应的体素的初始局部TSDF值的差的平方的加权和,权重等于特定体素经变换对应的体素的对应组的权重。
-
公开(公告)号:CN109754416A
公开(公告)日:2019-05-14
申请号:CN201711070256.X
申请日:2017-11-03
Applicant: 富士通株式会社
Abstract: 本公开涉及图像处理装置和方法。所述图像处理装置包括转换器,其将输入图像转换为深度图像,以获得针对所述输入图像的每一像素的转换的深度;以及分类器,其在所述转换的深度和来自深度数据集的真实深度之间进行分类,其中,对所述分类器和所述转换器进行训练,直到所述分类器不能区分所述转换的深度和所述真实深度。使用根据本公开的图像处理装置和方法,通过对抗训练可以从单幅图像中学习深度,这不仅可以通过转换器学习单幅图像的深度,还可以通过分类器了解深度的高阶一致性。通过这样的对抗训练,转换器可以输出与真实深度图具有相似分布的深度图。
-
公开(公告)号:CN104732580B
公开(公告)日:2018-09-25
申请号:CN201310717083.1
申请日:2013-12-23
Applicant: 富士通株式会社
IPC: G06T17/00
Abstract: 本申请公开了一种图像处理装置、图像处理方法和程序,该图像处理装置包括:特定区域检测单元,被配置为获取对象的拍摄图像,并检测拍摄图像中显示的、对象的表面的所有特定区域;模型构建单元,被配置为基于拍摄图像来构建能够体现对象的形状的使用曲面方程描述的立体模型;定位单元,被配置为在立体模型的表面上定位各个特定区域的对应区域;以及面积计算单元,被配置为基于立体模型计算对应区域的面积。
-
-
公开(公告)号:CN105427272A
公开(公告)日:2016-03-23
申请号:CN201410474894.8
申请日:2014-09-17
Applicant: 富士通株式会社
Abstract: 本公开提供一种图像处理设备、图像处理方法和电子装置。该图像处理设备用于对预定图像进行分割的图像处理设备,包括:相似度确定装置,用于获取所述预定图像的超像素,并确定所述预定图像中各个像素与所获取的超像素之间的相似度;以及分类装置,用于在所述预定图像中获取至少两个标记像素组,其中每个标记像素组对应于一个用户输入,并根据所述预定图像中各个像素与所述超像素之间的相似度,将所述预定图像中的未标记像素划分到与所述至少两个标记像素组对应的至少两个像素类别中,以对所述预定图像进行分割。根据本公开的图像处理设备、图像处理方法和电子装置至少能够提高图像分割处理的运行速度。
-
公开(公告)号:CN102737383B
公开(公告)日:2014-12-17
申请号:CN201110085676.1
申请日:2011-03-31
Applicant: 富士通株式会社
IPC: G06T7/20
CPC classification number: G06T7/20 , G06K9/00758
Abstract: 本发明实施例公开了视频中的摄像机运动分析方法及装置,其中一种方法包括:所述视频中分析出具有显著运动特征的视频片段及不具有显著运动特征的视频片段;对于不具有显著运动特征的视频片段,如果前一相邻视频片段对应的第一运动类型,与后一相邻视频片段对应的第二运动类型不同,则降低第一运动类型及第二运动类型的检测标准;判断所述不具有显著运动特征的视频片段是否满足所述降低后的检测标准;以及根据所述判断的结果,进行所述不具有显著运动特征的视频片段与相邻视频片段的合并。通过本发明实施例,能够更有效、准确地检测出视频中摄像机的运动类型,也更加准确地反映出用户的拍摄意图。
-
公开(公告)号:CN104135658A
公开(公告)日:2014-11-05
申请号:CN201410273270.X
申请日:2011-03-31
Applicant: 富士通株式会社
Abstract: 本发明实施例公开了在视频中检测摄像机运动类型的方法及装置,其中一种方法包括:获取所述视频中的变焦运动参数;根据所述变焦运动参数检测出所述视频中包含的摄像机运动类型为聚焦的视频片段;计算该视频片段中各帧图像的焦点位置;以及根据所述各帧图像的焦点位置,对该视频片段的检测结果进行验证。通过本发明实施例,能够更有效、准确地检测出视频中摄像机的运动类型。
-
公开(公告)号:CN119580025A
公开(公告)日:2025-03-07
申请号:CN202311160188.1
申请日:2023-09-07
Applicant: 富士通株式会社
IPC: G06V10/774 , G06V10/40 , G06V10/764 , G06V10/80 , G06V40/20 , G06F16/53
Abstract: 本公开内容涉及用于训练检测人‑物品交互的模型的方法、检测人‑物品交互的装置及存储介质。根据一个实施例,该用于训练检测人‑物品交互的模型的方法包括:从样本图像中提取视觉特征;基于视觉特征确定物品的预测位置、物品的预测分类及人员对物品执行的动作的预测动作分类,并生成第一查询向量;基于第一查询向量和视觉特征,确定人员的与物品接触的局部身体的预测位置,并生成第二查询向量;通过融合第一查询向量和第二查询向量生成第三查询向量;基于视觉特征和第三查询向量确定人员的预测位置;以及基于预测结果调整模型的参数。
-
公开(公告)号:CN113569591B
公开(公告)日:2024-05-10
申请号:CN202010349099.1
申请日:2020-04-28
Applicant: 富士通株式会社
Abstract: 本公开涉及一种图像处理装置、图像处理方法和机器可读存储介质。图像处理装置包括:检测单元,其在图像中的包括多个对象的区域中检测关于多个对象的二维2D关键点,其中多个对象彼此部分交叠;候选关键点集选择单元,其从2D关键点中选择针对多个对象中的一个对象的候选关键点集;估计单元,其基于候选关键点集来估计所述一个对象的三维3D模型;3D模型选择单元,其在估计出的3D模型中选择最佳3D模型;以及获取单元,其通过将最佳3D模型投影到图像的平面上来得到被分离的所述一个对象。该图像处理装置可以从包括多个对象的图像中分离出一个对象。
-
-
-
-
-
-
-
-
-