-
公开(公告)号:CN115862005A
公开(公告)日:2023-03-28
申请号:CN202211698870.1
申请日:2022-12-28
Applicant: 中国科学院计算技术研究所
IPC: G06V20/68 , G06V10/44 , G06V10/82 , G06N3/08 , G06N3/0464
Abstract: 本发明提供了一种食品检测系统、模型训练方法和食品检测方法,该系统包括基于神经网络构建的特征提取器和检测头,其中,特征提取器,用于根据多个处理层对输入的图像进行特征提取以得到图像特征,其中至少部分处理层为动态可变形卷积层,动态可变形卷积层包括多个可变形共享块,每个可变形共享块包括用于确定与输入的图像适配的变形参数的变形单元和多个用于根据该变形单元的变形参数调整卷积形态的动态卷积分支;检测头,用于根据图像特征对输入的图像进行检测,确定输入的图像中食品的位置区域和各位置区域对应的食品类别;本发明可提高食品检测模型的检测性能。
-
公开(公告)号:CN112183391A
公开(公告)日:2021-01-05
申请号:CN202011059356.4
申请日:2020-09-30
Applicant: 中国科学院计算技术研究所
IPC: G06K9/00 , G06K9/62 , G06F40/216 , G06F40/284 , G06N3/04 , G06N5/04
Abstract: 本发明一种第一视角视频行为预测系统,用于根据已有的视频进行行为预测,所述系统包括:视觉特征提取模块,用于提取已有视频中的视觉特征;基于直觉的预测模块,用于根据视觉特征提取模块提取到的视觉特征进行基于直觉的预测,得到第一预测结果;基于分析推理的预测模块,用于根据视觉特征提取模块提取到的视觉特征进行基于分析推理的预测,得到第二预测结果;自适应融合模块,用于采用注意力机制将将第一预测结果和第二预测结果进行有机融合,得到最终的行为预测结果。本发明将基于直觉的和基于分析推理的预测进行有机的结合,有效的缓解了“视觉鸿沟“问题,能更直接的从人类心理角度出发,更准确的预测其下一步动作,准确率更高,为实际工程应用提供更全面的支撑。
-
公开(公告)号:CN105426925B
公开(公告)日:2019-03-08
申请号:CN201511001231.5
申请日:2015-12-28
Applicant: 联想(北京)有限公司 , 中国科学院计算技术研究所
Abstract: 本发明提供一种图像标注方法和电子设备。所述方法包括:获取要标注的第一图像;获取与所述第一图像相关的多种不同类型的信息,所述多种不同类型的信息的每种用于标注所述第一图像涉及的一个或多个抽象概念类型;根据获取的所述多种类型的信息对所述第一图像的抽象概念类型执行概率推测,以获得所述第一图像的每个抽象概念类型的概率分布;确定每个抽象概念类型之间的相关性;以及根据确定的相关性,最大化各个抽象概念类型的联合概率,从而确定所述第一图像的标注结果。
-
公开(公告)号:CN105426925A
公开(公告)日:2016-03-23
申请号:CN201511001231.5
申请日:2015-12-28
Applicant: 联想(北京)有限公司 , 中国科学院计算技术研究所
CPC classification number: G06K9/00671 , G06K9/6277
Abstract: 本发明提供一种图像标注方法和电子设备。所述方法包括:获取要标注的第一图像;获取与所述第一图像相关的多种不同类型的信息,所述多种不同类型的信息的每种用于标注所述第一图像涉及的一个或多个抽象概念类型;根据获取的所述多种类型的信息对所述第一图像的抽象概念类型执行概率推测,以获得所述第一图像的每个抽象概念类型的概率分布;确定每个抽象概念类型之间的相关性;以及根据确定的相关性,最大化各个抽象概念类型的联合概率,从而确定所述第一图像的标注结果。
-
公开(公告)号:CN117743653A
公开(公告)日:2024-03-22
申请号:CN202311766725.7
申请日:2023-12-21
Applicant: 中国科学院计算技术研究所
IPC: G06F16/9035 , G06F16/36 , G06F16/28
Abstract: 本发明实施例提供了一种个性化食品推荐模型,包括数据获取模块,用于获取包括预设的多个食品实体与其属性实体间的关系的第一知识图谱和包括多个用户实体和多个食品实体间的历史交互关系的第二知识图谱;食品知识图谱处理模块,用于根据与食品实体有关系的属性实体对食品实体进行编码处理,得到食品实体的食品信息编码;食品个性化推荐模块,用于根据多个食品信息编码分别对第二知识图谱中的多个用户实体和多个食品实体进行处理,以确定多个食品实体分别与每个用户实体的匹配分数,根据所述匹配分数为每个用户生成个性化的推荐食品列表;本发明实施例结合食品信息编码和历史交互关系进行多种食品推荐,解决单一推荐时难以平衡偏好和营养等问题。
-
公开(公告)号:CN116434108A
公开(公告)日:2023-07-14
申请号:CN202310232698.9
申请日:2023-03-06
Applicant: 中国科学院计算技术研究所
IPC: G06V20/40 , G06V10/774 , G06V10/74 , G06V10/764 , G06V20/56
Abstract: 本发明提出一种基于循环一致性的第一视角视频行为预测方法和系统,通过在高维特征空间构建过去信息蒸馏损失函数、未来信息蒸馏损失函数、后向‑前向循环一致性损失函数以及前向‑后向循环一致性损失函数,充分学习过去内容和当前观察内容、当前观察内容和未来内容之间的时序上下文关系。在测试时,我们只根据观察内容去预测未来的行为,通过隐式地扩展可观察的时序范围,在一定程度上能够克服难以获取长距离时序信息的客观条件限制,进而利用更多的信息辅助进行行为预测。
-
公开(公告)号:CN111222546B
公开(公告)日:2023-04-07
申请号:CN201911373760.6
申请日:2019-12-27
Applicant: 中国科学院计算技术研究所
IPC: G06V10/764 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/045 , G06N3/047 , G06N3/08
Abstract: 本发明提供一种训练食品图像分类模型的方法,所述方法包括:对食品图像进行多尺度切割,形成包含原图像的多尺度食品切割图像;分别构建多个尺度的卷积神经网络模型,每个卷积神经网络模型对应一个尺度的食品切割图像;利用带有类别标签的食品图像作为目标图像,将其多尺度切割后代入多个尺度的卷积神经网络模型,利用预测的类别概率与真实的类别标签的比对结果作为反馈来进行多个尺度的卷积神经网络模型的优化。本发明创新性地提出了在原图像基础上进行多尺度切割形成多尺度切片的方式题。本发明在多个公共数据集都达到目前最好的识别性能:本发明的方法在公共数据集ETH Food‑101上可以达到90.56%的识别准确率,在公共数据集VireoFood‑172上可以达到90.61%的识别准确率。
-
公开(公告)号:CN114419391A
公开(公告)日:2022-04-29
申请号:CN202111621115.9
申请日:2021-12-27
Applicant: 北京三快在线科技有限公司 , 中国科学院计算技术研究所
IPC: G06V10/774 , G06V10/764 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种目标图像识别方法及装置、电子设备及可读存储介质。其中,该方法包括:将目标图像输入至预先训练完成的目标图像识别模型;通过目标图像识别模型的特征学习模块,获取目标图像对应的多个不同维度的多个局部特征,以及确定多个局部特征对应的多个第一向量表示;通过目标图像识别模型的特征增强模块,确定多个局部特征对应的第二向量表示;通过目标图像识别模型的特征分类模块,对多个第一向量表示以及第二向量表示进行分类,以得到目标图像的预测结果。本发明解决了由于相关技术中食品图像预测结果准确性低的技术问题。
-
公开(公告)号:CN111046920A
公开(公告)日:2020-04-21
申请号:CN201911152246.X
申请日:2019-11-22
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种训练食品图像分类模型的方法及图像分类方法,所述方法包括:分别构建多尺度的食品原材料神经网络以及多尺度的食品类别神经网络,对目标图像进行多尺度划分;对于目标图像的每种类型特征,分别进行多尺度融合,对于融合后的三种类型特征进行融合;将融合后的特征输入到基于融合特征的分类器进行分类。本发明创新性地提出了高级食品语义分布和深度视觉特征的互补性融合,并且进一步将原材料属性信息与高级食品语义分布和深度视觉特征进行融合,解决了食品图像的非刚性结构和几何变形问题,更加有利于食品图像的识别。并且,本发明通过多尺度融合方式,弥补了食品图像不具备空间排列特性的缺陷,最大限度地提高了分类性能。
-
-
-
-
-
-
-
-