-
公开(公告)号:CN111353076B
公开(公告)日:2023-10-10
申请号:CN202010108535.6
申请日:2020-02-21
Applicant: 华为云计算技术有限公司
IPC: G06F16/903 , G06F16/907 , G06V10/74 , G06V10/82 , G06N3/0464 , G06N3/084 , G06N3/088
Abstract: 本申请提供了训练跨模态检索模型的方法、跨模态检索的方法和相关装置。涉及人工智能领域。该方法包括利用无监督学习确定参考模型;基于该参考模型和训练数据进行知识蒸馏,得到训练数据的相似数据;利用训练数据的相似数据和训练数据,可以进行有监督学习,从而得到跨模态检索模型。本申请能够实现在不需要人工标注有监督学习使用的训练数据的标签的情况下,还能够保证训练出的跨模态检索模型的较高的准确率。
-
公开(公告)号:CN117830662A
公开(公告)日:2024-04-05
申请号:CN202211179875.3
申请日:2022-09-27
Applicant: 华为云计算技术有限公司
IPC: G06V10/74 , G06V10/26 , G06V10/764
Abstract: 本申请涉及人工智能技术领域,公开了一种预训练方法、装置、计算设备集群、及存储介质,该方法包括:将第一图像输入预训练模型得到多个第一像素的特征,其中,第一图像属于多个数据集中的第一数据集,多个数据集与多个标签集一一对应,第一图像包括上述多个第一像素,多个第一像素中的每个第一像素的标签都属于第一数据集对应的标签集,多个标签集中的所有标签分别有一个对应的文本特征;根据上述多个第一像素的特征和多个标签集中的所有标签对应的文本特征更新预训练模型。本申请能够利用多个数据集进行联合预训练,并能自动利用不同数据集的标注之间的联系,从而提升预训练效果。
-
公开(公告)号:CN117994554A
公开(公告)日:2024-05-07
申请号:CN202211350484.3
申请日:2022-10-31
Applicant: 华为云计算技术有限公司
IPC: G06V10/764
Abstract: 本申请提供一种识别方法、装置及相关设备,该方法包括:计算设备将待识别图像输入多个训练好的识别模型,其中,每个训练好的识别模型包括图像语言预训练模型和包括多个提示词的提示模板,各个训练好的识别模型的提示模板各不相同;计算设备基于多个训练好的识别模型确定待识别图像属于各个类别的概率,其中,第i个训练好的识别模型输出待识别图像属于第i个训练好的识别模型对应的多个类别的概率;最后根据待识别图像属于各个类别的概率,确定待识别图像的类别。通过将数据集进行分组,并通过视觉语言预训练模型和提示模板相结合的方式,训练用于未知类检测的模型,能够提高模型对闭集之外的未知类的检测精度,提高模型分类精度。
-
-