-
公开(公告)号:CN118628784A
公开(公告)日:2024-09-10
申请号:CN202310671260.0
申请日:2023-06-07
Applicant: 华为云计算技术有限公司
IPC: G06V10/764 , G06V10/774 , G06V10/10
Abstract: 本申请提供了一种图像分类模型的训练方法、图像分类方法及相关装置。其中,上述图像分类模型的训练方法可以应用于训练装置。训练装置获取训练数据集,训练数据集包括多张训练图像。然后,训练装置为每张训练图像拼接提示向量和预训练模型的掩码向量,得到每张训练图像对应的目标输入向量,此处的预训练模型是通过掩码向量训练得到。之后,训练装置基于该预训练模型和每张训练图像对应的目标输入向量对上述提示向量进行优化,得到图像分类模型,该图像分类模型的参数包括预训练模型的参数(例如,掩码向量)和已优化的提示向量,该图像分类模型用于执行图像分类任务。通过上述方法可以提高图像分类模型的训练效率,降低图像分类模型的训练成本。
-
公开(公告)号:CN118135182A
公开(公告)日:2024-06-04
申请号:CN202211494931.2
申请日:2022-11-26
Applicant: 华为云计算技术有限公司
IPC: G06V10/25 , G06V10/44 , G06V10/774 , G06V10/82 , G06N3/08 , G06N3/0464
Abstract: 本申请公开了一种目标检测方法、装置及计算设备集群,该方法包括:基于模板在输入图像中进行匹配,确定第一区域,其中,模板为样本图像中的第一目标的部分或者全部,或者,为样本图像中除第一目标外的部分或者全部,第一区域包括第一目标的部分或者全部;根据第一区域生成多个第一候选区域;利用目标检测模型根据多个第一候选区域,生成第一检验结果。通过上述过程,服务器将模板匹配和深度目标检测模型相结合,根据模板匹配,确定第一区域,再根据第一区域生成多个第一候选区域,利用目标检测模型根据多个候选区域生成检验结果,可以优化目标检测性能,对新颖样本等实现更加准确的目标检测。
-
公开(公告)号:CN111382781B
公开(公告)日:2023-09-12
申请号:CN202010109046.2
申请日:2020-02-21
Applicant: 华为云计算技术有限公司
IPC: G06V10/764 , G06V10/774 , G06V10/40
Abstract: 本申请提供利用人工智能技术的图像处理领域中的获取图像标签的方法、训练图像识别模型的方法、图像识别方法和相关装置。本申请提供的方法中,获取到一般类别图像属于多种精细粒度类别中每种精细粒度类别的概率之后,计算这些类别基于对应的概率的熵信息,并在熵小于或等于预设的阈值时,根据这些精细粒度类别对应的概率确定该一般类别图像的精细粒度类别,以便于使用该一般类别图像和其精细粒度类别对精细图像识别模型进行训练。本申请的技术方案可以提高精细图像识别模型的性能。
-
公开(公告)号:CN117994554A
公开(公告)日:2024-05-07
申请号:CN202211350484.3
申请日:2022-10-31
Applicant: 华为云计算技术有限公司
IPC: G06V10/764
Abstract: 本申请提供一种识别方法、装置及相关设备,该方法包括:计算设备将待识别图像输入多个训练好的识别模型,其中,每个训练好的识别模型包括图像语言预训练模型和包括多个提示词的提示模板,各个训练好的识别模型的提示模板各不相同;计算设备基于多个训练好的识别模型确定待识别图像属于各个类别的概率,其中,第i个训练好的识别模型输出待识别图像属于第i个训练好的识别模型对应的多个类别的概率;最后根据待识别图像属于各个类别的概率,确定待识别图像的类别。通过将数据集进行分组,并通过视觉语言预训练模型和提示模板相结合的方式,训练用于未知类检测的模型,能够提高模型对闭集之外的未知类的检测精度,提高模型分类精度。
-
公开(公告)号:CN117333690A
公开(公告)日:2024-01-02
申请号:CN202210712315.3
申请日:2022-06-22
Applicant: 华为云计算技术有限公司
IPC: G06V10/764 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/045 , G06N3/0464 , G06N3/088 , G06N3/09
Abstract: 本申请实现方式公开了一种图像分类模型的训练方法,该方法包括:确定训练数据集,以及确定初始图像分类模型,训练数据集包括多个训练样本图像,初始图像分类模型包括第一初始图像分类模块,第一初始图像分类模块为基于全局注意力机制、且具备对长度可变的多图序列进行分类的能力的图像分类模块,多图序列为包括多个图像的图像序列;根据训练数据集,以及预设的用于图像分类的分类向量,对初始图像分类模型进行模型训练,得到初始图像分类模型对应的目标图像分类模型。如此,得到的目标图像分类模型可以实现对长度可变的多图序列的图像分类,并且提高了图像识别效果和图像分类精确度。本申请实现方式还公开了一种图像分类方法和计算设备集群。
-
公开(公告)号:CN119646500A
公开(公告)日:2025-03-18
申请号:CN202311196358.1
申请日:2023-09-15
Applicant: 华为云计算技术有限公司
IPC: G06F18/214 , G06N3/0985 , G06N3/0495 , G06N5/04
Abstract: 本申请提供了模型训练方法、装置及计算机存储介质。方法包括获取预训练好的模型;预训练好的模型包括第一模型参数的第一参数值(通过第一比特宽度存储);对预训练好的模型进行量化,得到量化模型;量化模型包括第一模型参数的第二参数值(通过小于第一比特宽度的第二比特宽度存储)和量化参数,第二参数值为通过量化尺度(共享量化参数的参数值数目)对第一参数值量化得到;将样本作为量化模型的输入,基于量化尺度对样本进行聚合后的结果作为目标模型的输入,基于量化模型和目标模型的输出进行标签预测的预测结果、样本的标签训练目标模型;基于训练好的目标模型修正量化参数。修正后的量化模型可以直接进行低比特推理,可以提高部署效率。
-
公开(公告)号:CN117635925A
公开(公告)日:2024-03-01
申请号:CN202210957936.8
申请日:2022-08-10
Applicant: 华为云计算技术有限公司
Abstract: 本申请公开了一种图像语义分割方法和装置,该方法包括:利用特征金字塔网络FPN对第一图像进行特征提取,得到多个特征图;该多个特征图是分别由FPN中的不同网络层输出得到的;对多个特征图进行融合,得到第一特征图,并利用解码器Decoder对第一特征图进行处理,得到第一图像的语义分割结果。FPN包括第一网络层,第一网络层包括变换器模块,变换器模块包括第一自注意力模块和第一卷积模块;第一网络层输出的特征图是基于第一自注意力模块输出的第三特征图和第一卷积模块输出的第四特征图生成的。通过本申请,可兼顾全局和局部语义的提取,从而提升图像语义分割的精度和效果;同时还可大幅降低计算复杂度。
-
公开(公告)号:CN111292331B
公开(公告)日:2023-09-12
申请号:CN202010110152.2
申请日:2020-02-23
Applicant: 华为云计算技术有限公司
IPC: G06T7/10
Abstract: 本申请提供一种图像处理的方法与装置。涉及人工智能领域,具体涉及计算机视觉领域。该方法包括:基于第一种图像处理任务的原始特征数据获取第一空间特征信息;根据第二种图像处理任务的原始特征数据与第一空间特征信息,获取第二特征数据;对第二特征数据进行第二种图像处理,获得第二种图像处理任务的处理结果;第一种图像处理任务与第二种图像处理任务分别为目标检测任务与实例分割任务中的一种与另一种。通过目标检测与实例分割中一方给另一方提供空间特征信息,目标检测和/或实例分割的特征数据可以得到校正,可以提高实例分割任务的预测准确度。
-
公开(公告)号:CN116543212A
公开(公告)日:2023-08-04
申请号:CN202310508256.2
申请日:2023-05-06
Applicant: 深圳华为云计算技术有限公司
IPC: G06V10/764 , G06V10/774 , G06V10/82
Abstract: 本申请涉及一种图像分类方法、装置和存储介质。该方法包括:获取待分类图像;利用神经网络模型对待分类图像进行处理,得到待分类图像的分类结果,神经网络模型基于不平衡分布的训练样本训练得到,待分类图像的分类结果包括基于极坐标系下神经网络模型的参数和极坐标系下待分类图像的特征向量确定的第一分类结果。根据本申请实施例,能够消除在直角坐标系下进行分类时不平衡的数据对预测结果的影响,提升预测结果的准确性,同时,由于可以直接利用训练后的神经网络模型的参数,将原本的预测空间从正交空间转化到极坐标空间,无需重新训练,简单快速,开销更小,更加灵活。
-
公开(公告)号:CN115965828A
公开(公告)日:2023-04-14
申请号:CN202110529942.9
申请日:2021-05-14
Applicant: 华为云计算技术有限公司
IPC: G06V10/774 , G06V10/82 , G06V10/764 , G06V10/77 , G06N3/0464
Abstract: 本申请实施例提供了一种图像分类方法和电子设备。本申请实施例提供的技术方案中,通过编码器对有监督训练集和无监督测试集进行特征提取,得到所述有监督训练集在隐层空间的第一低维特征和所述无监督测试集在所述隐层空间的第二低维特征;根据所述第一低维特征得到每个类别的中心原型向量;根据所述中心原型向量和所述第二低维特征得到所述第二低维特征与所述中心原型向量的相似性;根据所述相似性挑选出正样本;通过将所述正样本与所述无监督测试集进行对比学习,得到图像分类模型。本申请实施例通过将对比学习引入半监督学习领域,能够利用少量的标签对数据进行分类,并达到良好的分类效果。
-
-
-
-
-
-
-
-
-