-
公开(公告)号:CN114118218B
公开(公告)日:2025-05-02
申请号:CN202111283429.2
申请日:2021-11-01
Applicant: 北京三快在线科技有限公司 , 中国科学院计算技术研究所
IPC: G06V10/774 , G06N3/0464 , G06N3/08
Abstract: 本说明书公开了一种模型训练的方法,由于终端可以从待训练模型所需的基础损失函数中,以用于收敛该待训练模型中模型参数的相关项作为导函数,并通过求解出该导函数的方式,得到用于训练待训练模型的实际损失函数,这样可以有效地去除基础损失函数中冗余项对待训练模型过程中的不利影响,从而有效地提高了模型训练的效率。
-
公开(公告)号:CN111222546A
公开(公告)日:2020-06-02
申请号:CN201911373760.6
申请日:2019-12-27
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种训练食品图像分类模型的方法,所述方法包括:对食品图像进行多尺度切割,形成包含原图像的多尺度食品切割图像;分别构建多个尺度的卷积神经网络模型,每个卷积神经网络模型对应一个尺度的食品切割图像;利用带有类别标签的食品图像作为目标图像,将其多尺度切割后代入多个尺度的卷积神经网络模型,利用预测的类别概率与真实的类别标签的比对结果作为反馈来进行多个尺度的卷积神经网络模型的优化。本发明创新性地提出了在原图像基础上进行多尺度切割形成多尺度切片的方式题。本发明在多个公共数据集都达到目前最好的识别性能:本发明的方法在公共数据集ETH Food-101上可以达到90.56%的识别准确率,在公共数据集VireoFood-172上可以达到90.61%的识别准确率。
-
公开(公告)号:CN118486430A
公开(公告)日:2024-08-13
申请号:CN202410715987.9
申请日:2024-06-04
Applicant: 中国科学院计算技术研究所
IPC: G16H20/60 , G06F18/25 , G06F16/332 , G06N3/0455 , G06N3/08
Abstract: 本发明提出一种多任务智能膳食管理方法、装置、存储介质、计算机设备,该方法包含:构建专门面向食品领域的食品多模态基础模型;将该食品多模态基础模型中融合多模态数据融合模块,以食品图像与膳食问题共同作为多模态输入,输出膳食上下文Token;将该食品多模态基础模型中融合多个细粒度食品分析模块,依据该膳食上下文Token,对不同类别的食品进行细粒度的特征提取,输出细粒度食品特征分析结果;依据该细粒度食品特征分析结果以及该膳食上下文Token,利用问答模型生成膳食回答。该方法通过精确定位用户的膳食问题,匹配精准的膳食回答,提高了膳食场景下膳食管理的准确性,同时提高了用户饮食体验。
-
公开(公告)号:CN115797924A
公开(公告)日:2023-03-14
申请号:CN202211579758.6
申请日:2022-12-06
Applicant: 中国科学院计算技术研究所
IPC: G06V20/68 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/08 , G06F16/583
Abstract: 一种用于食品图像分类的模型的训练方法,所述模型包括特征提取器和分类器,所述方法包括:S1、获取包含多个样本和对应标签的初始的训练集并将其划分为多个批次,在每个批次基于当前批次中的样本构建多个包含锚样本、正样本和负样本的三元组,其中,每个样本为一张食品图像,样本对应的标签指示食品图像的类别;S2、对初始的训练集的每个批次选定部分三元组进行优化,优化时将选定的三元组的负样本用其正样本替代并将选定的三元组的正样本用其锚样本替代以得到优化的三元组,基于优化的三元组与未选定的三元组构成优化的训练集;S3、利用优化的训练集训练用于提取样本特征的特征提取器以及用于根据样本特征对样本进行分类的分类器进行分批次训练。
-
公开(公告)号:CN111159539A
公开(公告)日:2020-05-15
申请号:CN201911251785.9
申请日:2019-12-09
Applicant: 中国科学院计算技术研究所
IPC: G06F16/9535 , G16H20/60
Abstract: 本发明提出一种基于多模态信息关联分析的食物推荐方法,包括:根据用户的饮食需求和饮食范围生成第一模态信息;根据食物的自然属性和附加属性生成第二模态信息;根据该用户的实时身体状况和饮食环境状况生成第三模态信息;对该第一模态信息、该第二模态信息和该第三模态信息进行关联性分析,生成针对该用户的食物推荐结果。
-
公开(公告)号:CN111159539B
公开(公告)日:2023-09-22
申请号:CN201911251785.9
申请日:2019-12-09
Applicant: 中国科学院计算技术研究所
IPC: G06F16/9535 , G16H20/60
Abstract: 本发明提出一种基于多模态信息关联分析的食物推荐方法,包括:根据用户的饮食需求和饮食范围生成第一模态信息;根据食物的自然属性和附加属性生成第二模态信息;根据该用户的实时身体状况和饮食环境状况生成第三模态信息;对该第一模态信息、该第二模态信息和该第三模态信息进行关联性分析,生成针对该用户的食物推荐结果。
-
公开(公告)号:CN115359395A
公开(公告)日:2022-11-18
申请号:CN202210985312.7
申请日:2022-08-17
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种基于反事实分析的第一视角视频行为预测模型训练方法,采用第一视角视频训练集对预测模型进行多轮迭代训练直至收敛,其中,每轮训练包括:分别提取每个样本的视觉特征和语义特征;分别对视觉特征和语义特征进行编解码处理得到视觉特征对应的下一时刻的高维特征向量和语义特征对应的下一时刻的高维特征向量;基于高维特征向量分别获得下一时刻的反事实预测向量和事实预测向量;从每个样本对应的事实预测向量中按照相似度抠除反事实预测向量得到下一时刻的最终行为预测向量;每个样本的下一时刻的行为对应的最终预测向量与对应下一时刻的行为标签对应的向量之间的交叉熵损失更新预测模型的参数。
-
公开(公告)号:CN114118218A
公开(公告)日:2022-03-01
申请号:CN202111283429.2
申请日:2021-11-01
Applicant: 北京三快在线科技有限公司 , 中国科学院计算技术研究所
Abstract: 本说明书公开了一种模型训练的方法,由于终端可以从待训练模型所需的基础损失函数中,以用于收敛该待训练模型中模型参数的相关项作为导函数,并通过求解出该导函数的方式,得到用于训练待训练模型的实际损失函数,这样可以有效地去除基础损失函数中冗余项对待训练模型过程中的不利影响,从而有效地提高了模型训练的效率。
-
公开(公告)号:CN112906780A
公开(公告)日:2021-06-04
申请号:CN202110171006.5
申请日:2021-02-08
Applicant: 中国科学院计算技术研究所
Abstract: 本发明公开了一种果蔬图像分类系统,包括用于提取输入果蔬图像特征图的卷积神经网络、用于识别果蔬图像的低维特征图中的低维关键特征图的低维SCA注意力模块、用于识别果蔬图像的中维特征图中的中维关键特征图的中维SCA注意力模块、用于识别果蔬图像的高维特征图中的高维关键特征图的高维SCA注意力模块、与每一个SCA注意力模块链接的池化层;所述果蔬图像分类系统还包括:多尺度特征融合模块,用于对经池化处理后的低维关键特征图、中维关键特征图、高维关键特征图进行融合处理,生成统一的特征表示;全连接层,用于根据统一的特征表示对果蔬图像进行分类。
-
公开(公告)号:CN111062424A
公开(公告)日:2020-04-24
申请号:CN201911232161.2
申请日:2019-12-05
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供小样本食品图像识别模型训练方法及食品图像识别方法。本发明的模型训练方法包括:利用训练数据集构建包含正、负样本以及锚图像的三元组,输入三元卷积神经网络提取三元组的特征表示;进行特征图融合,获得正负样本图像对特征图;基于所述关系值得分对所述正、负样本图像进行筛选,利用筛选后的正负样本图像对所述特征嵌入网络和关系学习网络进行训练。
-
-
-
-
-
-
-
-
-