-
公开(公告)号:CN114118218B
公开(公告)日:2025-05-02
申请号:CN202111283429.2
申请日:2021-11-01
Applicant: 北京三快在线科技有限公司 , 中国科学院计算技术研究所
IPC: G06V10/774 , G06N3/0464 , G06N3/08
Abstract: 本说明书公开了一种模型训练的方法,由于终端可以从待训练模型所需的基础损失函数中,以用于收敛该待训练模型中模型参数的相关项作为导函数,并通过求解出该导函数的方式,得到用于训练待训练模型的实际损失函数,这样可以有效地去除基础损失函数中冗余项对待训练模型过程中的不利影响,从而有效地提高了模型训练的效率。
-
公开(公告)号:CN114118218A
公开(公告)日:2022-03-01
申请号:CN202111283429.2
申请日:2021-11-01
Applicant: 北京三快在线科技有限公司 , 中国科学院计算技术研究所
Abstract: 本说明书公开了一种模型训练的方法,由于终端可以从待训练模型所需的基础损失函数中,以用于收敛该待训练模型中模型参数的相关项作为导函数,并通过求解出该导函数的方式,得到用于训练待训练模型的实际损失函数,这样可以有效地去除基础损失函数中冗余项对待训练模型过程中的不利影响,从而有效地提高了模型训练的效率。
-
公开(公告)号:CN114419391A
公开(公告)日:2022-04-29
申请号:CN202111621115.9
申请日:2021-12-27
Applicant: 北京三快在线科技有限公司 , 中国科学院计算技术研究所
IPC: G06V10/774 , G06V10/764 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种目标图像识别方法及装置、电子设备及可读存储介质。其中,该方法包括:将目标图像输入至预先训练完成的目标图像识别模型;通过目标图像识别模型的特征学习模块,获取目标图像对应的多个不同维度的多个局部特征,以及确定多个局部特征对应的多个第一向量表示;通过目标图像识别模型的特征增强模块,确定多个局部特征对应的第二向量表示;通过目标图像识别模型的特征分类模块,对多个第一向量表示以及第二向量表示进行分类,以得到目标图像的预测结果。本发明解决了由于相关技术中食品图像预测结果准确性低的技术问题。
-
公开(公告)号:CN118486430A
公开(公告)日:2024-08-13
申请号:CN202410715987.9
申请日:2024-06-04
Applicant: 中国科学院计算技术研究所
IPC: G16H20/60 , G06F18/25 , G06F16/332 , G06N3/0455 , G06N3/08
Abstract: 本发明提出一种多任务智能膳食管理方法、装置、存储介质、计算机设备,该方法包含:构建专门面向食品领域的食品多模态基础模型;将该食品多模态基础模型中融合多模态数据融合模块,以食品图像与膳食问题共同作为多模态输入,输出膳食上下文Token;将该食品多模态基础模型中融合多个细粒度食品分析模块,依据该膳食上下文Token,对不同类别的食品进行细粒度的特征提取,输出细粒度食品特征分析结果;依据该细粒度食品特征分析结果以及该膳食上下文Token,利用问答模型生成膳食回答。该方法通过精确定位用户的膳食问题,匹配精准的膳食回答,提高了膳食场景下膳食管理的准确性,同时提高了用户饮食体验。
-
公开(公告)号:CN115797924A
公开(公告)日:2023-03-14
申请号:CN202211579758.6
申请日:2022-12-06
Applicant: 中国科学院计算技术研究所
IPC: G06V20/68 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/08 , G06F16/583
Abstract: 一种用于食品图像分类的模型的训练方法,所述模型包括特征提取器和分类器,所述方法包括:S1、获取包含多个样本和对应标签的初始的训练集并将其划分为多个批次,在每个批次基于当前批次中的样本构建多个包含锚样本、正样本和负样本的三元组,其中,每个样本为一张食品图像,样本对应的标签指示食品图像的类别;S2、对初始的训练集的每个批次选定部分三元组进行优化,优化时将选定的三元组的负样本用其正样本替代并将选定的三元组的正样本用其锚样本替代以得到优化的三元组,基于优化的三元组与未选定的三元组构成优化的训练集;S3、利用优化的训练集训练用于提取样本特征的特征提取器以及用于根据样本特征对样本进行分类的分类器进行分批次训练。
-
公开(公告)号:CN106127257B
公开(公告)日:2022-05-31
申请号:CN201610509623.0
申请日:2016-06-30
Applicant: 联想(北京)有限公司 , 中国科学院计算技术研究所
IPC: G06V10/764 , G06K9/62
Abstract: 本发明公开了一种数据分类方法,用于提供一种较好的增量学习的方式。所述方法包括:获取待学习的第一数据;通过分类器根据所述第一数据确定N个分界面;所述分界面用于对数据进行分类;N为正整数;基于所述N个分界面确定至少两个数据类别,且将所述第一数据分配到所述至少两个数据类别中的第一数据类别;所述第一数据类别为根据所述第一数据新增的数据类别或原有的数据类别。本发明还公开了相应的电子设备。
-
公开(公告)号:CN106469437B
公开(公告)日:2020-08-25
申请号:CN201510508531.6
申请日:2015-08-18
Applicant: 联想(北京)有限公司 , 中国科学院计算技术研究所
Abstract: 提供了一种图像处理方法和图像处理装置。所述图像处理方法包括:将待处理的图像平均划分为多个图像块;获得所述图像块的语义描述信息;基于所述图像块在所述图像中的空间位置和所述图像块的语义描述信息确定所述图像的语义描述信息。在本公开实施例的技术方案中,能够有机地联系整个图像中的相关图像块来确定图像的语义描述信息,更符合对图像的理解习惯。
-
公开(公告)号:CN111159539A
公开(公告)日:2020-05-15
申请号:CN201911251785.9
申请日:2019-12-09
Applicant: 中国科学院计算技术研究所
IPC: G06F16/9535 , G16H20/60
Abstract: 本发明提出一种基于多模态信息关联分析的食物推荐方法,包括:根据用户的饮食需求和饮食范围生成第一模态信息;根据食物的自然属性和附加属性生成第二模态信息;根据该用户的实时身体状况和饮食环境状况生成第三模态信息;对该第一模态信息、该第二模态信息和该第三模态信息进行关联性分析,生成针对该用户的食物推荐结果。
-
公开(公告)号:CN106127257A
公开(公告)日:2016-11-16
申请号:CN201610509623.0
申请日:2016-06-30
Applicant: 联想(北京)有限公司 , 中国科学院计算技术研究所
IPC: G06K9/62
CPC classification number: G06K9/6286 , G06K9/6269
Abstract: 本发明公开了一种数据分类方法,用于提供一种较好的增量学习的方式。所述方法包括:获取待学习的第一数据;通过分类器根据所述第一数据确定N个分界面;所述分界面用于对数据进行分类;N为正整数;基于所述N个分界面确定至少两个数据类别,且将所述第一数据分配到所述至少两个数据类别中的第一数据类别;所述第一数据类别为根据所述第一数据新增的数据类别或原有的数据类别。本发明还公开了相应的电子设备。
-
公开(公告)号:CN101894276B
公开(公告)日:2012-09-05
申请号:CN201010195802.4
申请日:2010-06-01
Applicant: 中国科学院计算技术研究所
IPC: G06K9/66
CPC classification number: G06K9/00335 , G06K9/4671 , G06K2009/3291
Abstract: 本发明提供一种人体动作识别的训练方法,包括:从视频文件中提取时空兴趣点;将所有时空兴趣点根据其所包含的特征描述子量化到相应的视频单词上,并为视频单词生成统计直方图;根据视频单词所在时空邻域内的时空上下文信息得到该视频单词所在时空邻域内的其它视频单词,由该视频单词与某一满足时空约束的其它视频单词形成时空视频词组;对视频单词所在时空邻域内的时空上下文做聚类,得到语境单词,由视频单词与语境单词形成时空视频单词团体;从时空视频词组中选择代表性时空视频词组,从时空视频单词团体中选择代表性时空视频单词团体;利用视频单词、代表性时空视频词组、代表性时空视频单词团体中的一种特征或将多种特征融合后的结果训练分类器。
-
-
-
-
-
-
-
-
-