-
公开(公告)号:CN108319988B
公开(公告)日:2021-12-24
申请号:CN201710038008.0
申请日:2017-01-18
Abstract: 本发明公开了一种用于手写汉字识别的深度神经网络的加速方法,包括步骤:构建并训练出一个针对脱机手写汉字识别卷积神经网络;根据所需加速的倍数,计算低秩分解后第一个卷积层输出特征图的数目;针对逐层分解的卷积层进行训练;对所述用于手写汉字识别的深度神经网络进行重新训练,从而进行微调;编写所述用于手写汉字识别的深度神经网络的前向代码。本发明破除了传统的基于改进二次判别函数(MQDF)的分类器文字识别方法,采用深度卷积神经网络针对手写文字识别,并且将Batch Normalization和PReLU引入到网络设计之中,显著提高网络的识别率;加速网络收敛,增加网络的拟合能力。
-
公开(公告)号:CN113537549A
公开(公告)日:2021-10-22
申请号:CN202010322730.9
申请日:2020-04-22
Applicant: 富士通株式会社
Abstract: 本申请公开一种信息处理装置和信息处理方法。该信息处理装置包括:历史数据获取单元,被配置成获取关于资源的历史数据;编码序列获取单元,被配置成针对资源包括的每个部分,基于该部分的历史数据获取表征该部分在过去各个单位时段内被使用的数量的相对变化趋势的编码序列;聚类单元,被配置成基于资源包括的各个部分的编码序列之间的相似度,对历史数据执行聚类,以获取至少一个聚类;模型建立单元,被配置成针对每一个聚类,至少利用该聚类中的部分历史数据或所有历史数据建立相应的预测模型;以及预测单元,被配置成针对资源包括的每个部分,利用针对该部分的历史数据所属于的聚类的预测模型,预测该部分在预定时段内要被使用的数量。
-
公开(公告)号:CN113453067A
公开(公告)日:2021-09-28
申请号:CN202010230229.X
申请日:2020-03-27
Applicant: 富士通株式会社
IPC: H04N21/44 , H04N21/472 , G06K9/00 , G06K9/62
Abstract: 本公开涉及一种视频处理装置、视频处理方法和机器可读存储介质。视频处理装置包括:获取单元,其基于动作视频剪辑得到初始标记帧;设置单元,其基于关于所述动作视频剪辑的信息来设置滑动窗;匹配单元,其将所述初始标记帧与所述动作视频剪辑在所述滑动窗中的每个帧进行相似度匹配;以及选择单元,其基于相似度匹配的结果,选择所述动作视频剪辑在所述滑动窗中的一个帧作为标记帧。该视频处理装置可以在周期动作片段中正确地捕捉某一次动作实例。
-
公开(公告)号:CN112784635A
公开(公告)日:2021-05-11
申请号:CN201911081768.5
申请日:2019-11-07
Applicant: 富士通株式会社
Abstract: 公开了一种信息处理装置和方法以及利用模型分类的装置。信息处理装置包括:第一训练单元,其使用第一训练样本集对第一模型进行训练,以得到经训练的第一模型;第二训练单元,其在保留经训练的第一模型的预定部分的特性的情况下,使用第二训练样本集对经训练的第一模型进行训练,以得到经训练的第二模型;以及第三训练单元,其在使经训练的第二模型和第三模型的分类性能之间的差异在第一预定范围内的情况下,使用第二训练样本集对第三模型进行训练,以得到经训练的第三模型作为最终模型,其中,第一模型、经训练的第一模型、经训练的第二模型和第三模型中的每个包括至少一个特征提取层。
-
公开(公告)号:CN111598113A
公开(公告)日:2020-08-28
申请号:CN201910126230.5
申请日:2019-02-20
Applicant: 富士通株式会社
Abstract: 本公开涉及模型优化方法、数据识别方法和数据识别装置。优化数据识别模型的方法包括:获取待优化的数据识别模型的损失函数;计算损失函数中与类对应的权重向量;对权重向量进行归一化处理;通过增大权重向量中任两个权重向量间的夹角来更新损失函数;基于更新的损失函数来优化待优化的数据识别模型。
-
公开(公告)号:CN111461155A
公开(公告)日:2020-07-28
申请号:CN201910105993.1
申请日:2019-01-18
Applicant: 富士通株式会社
IPC: G06K9/62
Abstract: 公开了一种训练分类模型的装置和方法。训练分类模型的装置包括:第一获得单元,将样本图像输入第一机器学习架构来获得第一分类概率和第一分类损失;第二获得单元,将样本图像所属的实体的第二图像输入第二机器学习架构来获得第二分类概率和第二分类损失,第一机器学习架构和第二机器学习架构的结构相同并且共享相同的参数;相似度损失计算单元,计算与第一分类概率和第二分类概率之间的相似度相关的相似度损失;总损失计算单元,对于训练集中的所有样本图像,计算相似度损失、第一分类损失以及第二分类损失之和作为总损失;以及训练单元,以使总损失最优化的方式来调节第一机器学习架构和第二机器学习架构的参数,从而获得经训练的分类模型。
-
公开(公告)号:CN109872721A
公开(公告)日:2019-06-11
申请号:CN201711268086.6
申请日:2017-12-05
Applicant: 富士通株式会社
Abstract: 本公开提供了语音认证方法、信息处理设备以及存储介质。该语音认证方法包括:随机生成由预定素材集中的元素构成的认证序列;提示被测用户以语音方式输入认证序列,得到待认证语音序列;从待认证语音序列中提取语音特征;以及将所提取的语音特征输入到判别模型,以判断被测用户是否为特定注册用户,其中,判别模型基于从注册模型库中选择的、分别与认证序列的各个元素相对应的多个注册语音模型,其中,注册模型库包括分别与预定素材集中的各个元素相对应的注册语音模型,每个元素的注册语音模型是基于从特定用户对该元素的相应语音输入中提取的语音特征而单独预先训练得到的。
-
公开(公告)号:CN109685087A
公开(公告)日:2019-04-26
申请号:CN201710970935.6
申请日:2017-10-18
Applicant: 富士通株式会社
IPC: G06K9/62
CPC classification number: G06K9/627
Abstract: 公开了一种信息处理方法和装置以及信息检测方法和装置,其中信息处理方法包括:从训练集中抽取对应于相同的语义特征的三幅图像,所述三幅图像包括在语义特征方面具有相同语义特征值的第一图像和第二图像以及其语义特征值不同于第一图像和第二图像的第三图像;通过变分自编码器获得三幅图像的与语义特征对应的隐变量的分布;以及对于所述三幅图像中的每幅图像,通过使损失函数最小化来更新变分自编码器的参数,其中损失函数与第一图像的隐变量的分布和第二图像的隐变量的分布之间的第一距离正相关,与第一图像的隐变量的分布和第三图像的隐变量的分布之间的第二距离负相关。根据本公开的实施例,可以提取具有区分度的面部语义特征。
-
公开(公告)号:CN107273899A
公开(公告)日:2017-10-20
申请号:CN201610213567.6
申请日:2016-04-07
Applicant: 富士通株式会社
Abstract: 本发明公开了一种对象分类方法和对象分类设备。该方法包括:获得包含对象的输入图像中的每一个块的特征向量;基于预定义的字典,构建与每一个块的特征向量对应的稀疏向量,所述稀疏向量的非零元素的分布表明对应块是否属于对象所在的区域;合并属于对象所在区域的块对应的稀疏向量,以得到表明对象所在区域的合并向量;以及根据所述合并向量,确定对象的种类。
-
公开(公告)号:CN104239359B
公开(公告)日:2017-09-01
申请号:CN201310251807.8
申请日:2013-06-24
Applicant: 富士通株式会社
IPC: G06F17/30
CPC classification number: G06F17/30663 , G06F17/30017 , G06F17/30247 , G06F17/30256 , G06F17/30259 , G06F17/30268 , G06F17/3028
Abstract: 本发明实施例提供一种基于多模态的图像标注装置以及方法,所述图像标注装置包括:分数生成单元,利用训练图像及图像的多个模态,为查询图像生成多组关于标注词典中所有标签的第一分数;后融合单元,将获得的多组分数进行融合来获得关于所有标签的最终分数;标签选择单元,根据所有标签的最终分数,选择具有较大标签分数的一个或多个标签作为所述查询图像的标签。通过本发明实施例,可以对多个模态进行有效地融合;并且能获得更鲁棒且精确的图像标注结果。
-
-
-
-
-
-
-
-
-