-
-
公开(公告)号:CN104239359A
公开(公告)日:2014-12-24
申请号:CN201310251807.8
申请日:2013-06-24
Applicant: 富士通株式会社
IPC: G06F17/30
CPC classification number: G06F17/30663 , G06F17/30017 , G06F17/30247 , G06F17/30256 , G06F17/30259 , G06F17/30268 , G06F17/3028
Abstract: 本发明实施例提供一种基于多模态的图像标注装置以及方法,所述图像标注装置包括:分数生成单元,利用训练图像及图像的多个模态,为查询图像生成多组关于标注词典中所有标签的第一分数;后融合单元,将获得的多组分数进行融合来获得关于所有标签的最终分数;标签选择单元,根据所有标签的最终分数,选择具有较大标签分数的一个或多个标签作为所述查询图像的标签。通过本发明实施例,可以对多个模态进行有效地融合;并且能获得更鲁棒且精确的图像标注结果。
-
公开(公告)号:CN102737383B
公开(公告)日:2014-12-17
申请号:CN201110085676.1
申请日:2011-03-31
Applicant: 富士通株式会社
IPC: G06T7/20
CPC classification number: G06T7/20 , G06K9/00758
Abstract: 本发明实施例公开了视频中的摄像机运动分析方法及装置,其中一种方法包括:所述视频中分析出具有显著运动特征的视频片段及不具有显著运动特征的视频片段;对于不具有显著运动特征的视频片段,如果前一相邻视频片段对应的第一运动类型,与后一相邻视频片段对应的第二运动类型不同,则降低第一运动类型及第二运动类型的检测标准;判断所述不具有显著运动特征的视频片段是否满足所述降低后的检测标准;以及根据所述判断的结果,进行所述不具有显著运动特征的视频片段与相邻视频片段的合并。通过本发明实施例,能够更有效、准确地检测出视频中摄像机的运动类型,也更加准确地反映出用户的拍摄意图。
-
公开(公告)号:CN104135658A
公开(公告)日:2014-11-05
申请号:CN201410273270.X
申请日:2011-03-31
Applicant: 富士通株式会社
Abstract: 本发明实施例公开了在视频中检测摄像机运动类型的方法及装置,其中一种方法包括:获取所述视频中的变焦运动参数;根据所述变焦运动参数检测出所述视频中包含的摄像机运动类型为聚焦的视频片段;计算该视频片段中各帧图像的焦点位置;以及根据所述各帧图像的焦点位置,对该视频片段的检测结果进行验证。通过本发明实施例,能够更有效、准确地检测出视频中摄像机的运动类型。
-
公开(公告)号:CN103854275A
公开(公告)日:2014-06-11
申请号:CN201210505469.1
申请日:2012-11-30
Applicant: 富士通株式会社
IPC: G06T7/00
Abstract: 公开了一种用于确定三维模型中的整体空间划分的方法和设备及包括该设备的图像处理系统。该方法包括:第一实体集合识别步骤,对于三维模型中的每个凹入空间,识别三维模型中与该凹入空间具有公共平面且包含该凹入空间的第一实体集合;第二实体集合识别步骤,对于每个凹入空间,识别三维模型中与凹入空间没有公共平面但包含该凹入空间的第二实体集合;以及整体空间确定步骤,将第一实体集合和第二实体集合中的实体与凹入空间确定为整体空间。根据本发明,可以高效地识别与凹入空间具有公共平面和与凹入空间没有公共平面的实体与该凹入空间之间的关系,从而提高了模型分割的效率和合理性。
-
公开(公告)号:CN103578480A
公开(公告)日:2014-02-12
申请号:CN201210256326.1
申请日:2012-07-24
Abstract: 本发明公开了一种负面情绪检测中的基于上下文修正的语音情感识别方法,属于语音信号处理领域。本发明首先采集情感数据,并对其中的每一条语音进行特征提取,并且运用主分量分析的降维技术降低特征的维数,而后采用基于高斯混合模型的两类分类器分别对四类情感进行判别,得到当前时刻的情感矢量,最后根据前一时刻的情感矢量和当前的认知作业成绩来修正当前时刻的情感矢量,从而得到最终的语音情感识别结果。本发明可以有效的提高单纯采用高斯混合分类器的语音情感识别方法的识别性能,有效地检测认知过程相关的负面情绪状态。特别是在航天航海等特殊工作环境下,对检测和调节工作人员的负面情绪具有重要的应用价值。
-
公开(公告)号:CN103295216A
公开(公告)日:2013-09-11
申请号:CN201210046419.1
申请日:2012-02-24
Applicant: 富士通株式会社
IPC: G06T7/00
Abstract: 提供了一种用于识别三维模型中的空间的方法和设备以及包含该设备的图像处理系统。该方法包括步骤:对三维模型的顶点进行分类,其中,经由轮廓线彼此连通的顶点被分类到同一集合中;确定包含在基准面中的顶点的凸包,其中基准面是三维模型的包含属于不同集合的顶点的平面;以及识别满足以下条件的集合所限定的空间:该集合不包含凸包上的顶点,并且该集合中,通过轮廓线连接到基准面的顶点相对于基准面而言位于三维模型内侧。
-
公开(公告)号:CN101295305B
公开(公告)日:2012-10-31
申请号:CN200710104731.0
申请日:2007-04-25
Applicant: 富士通株式会社
CPC classification number: G06F17/30247
Abstract: 本发明公开了图像检索装置。该图像检索装置包括:未标注图像选择器,从图像库中选择一个或更多个未标注图像;主学习器,在图像检索的每一轮反馈中进行训练,估计所述图像库中图像与用户意图的相关性,并确定检索结果,其中在所述估计中,所述主学习器利用了所述未标注图像选择器所选择出的所述未标注图像。此外该图像检索装置还可包括:主动选择器,在所述每一轮反馈中,根据所述主学习器的估计结果从所述图像库中选择一个或更多个未标注图像供用户标注。
-
公开(公告)号:CN102375824A
公开(公告)日:2012-03-14
申请号:CN201010253505.0
申请日:2010-08-12
Applicant: 富士通株式会社
Abstract: 公开了一种用于获取内容彼此相对应的多种语言文本的装置,包括:关键图像生成单元,其被配置为生成与待获取的多种语言文本的内容相关的关键图像;和文本获取单元,其被配置为确定预定的信息源中与该关键图像相匹配的关键图像匹配信息,并根据预定规则从该关键图像匹配信息提取得到内容彼此相对应的多种语言文本。还公开一种用于获取内容彼此相对应的多种语言文本的方法。根据本发明实施例的解决方案可以改善所获取的多种语言对齐文本的精确度,此外还能够提高获取多种语言对齐文本的效率。
-
公开(公告)号:CN101261638A
公开(公告)日:2008-09-10
申请号:CN200810083542.4
申请日:2008-03-07
Applicant: 富士通株式会社
IPC: G06F17/30
CPC classification number: G06F17/30247 , G06K9/6204 , Y10S707/915
Abstract: 本发明提供了一种图像搜索的方法、装置及程序。根据本发明的一个方面,一种通过使用查询图像从数据库中搜索表示图像的图像数据的方法,该图像数据包括表示图像的轮廓的形状的信息,该方法包括:获得表示所述查询图像的查询图像数据;提取表示所述查询图像的轮廓的形状的信息;以及基于图像和所述查询图像的轮廓的形状的拓扑特性的相关性,确定所述数据库中的图像数据。
-
-
-
-
-
-
-
-
-