-
公开(公告)号:CN117830662A
公开(公告)日:2024-04-05
申请号:CN202211179875.3
申请日:2022-09-27
Applicant: 华为云计算技术有限公司
IPC: G06V10/74 , G06V10/26 , G06V10/764
Abstract: 本申请涉及人工智能技术领域,公开了一种预训练方法、装置、计算设备集群、及存储介质,该方法包括:将第一图像输入预训练模型得到多个第一像素的特征,其中,第一图像属于多个数据集中的第一数据集,多个数据集与多个标签集一一对应,第一图像包括上述多个第一像素,多个第一像素中的每个第一像素的标签都属于第一数据集对应的标签集,多个标签集中的所有标签分别有一个对应的文本特征;根据上述多个第一像素的特征和多个标签集中的所有标签对应的文本特征更新预训练模型。本申请能够利用多个数据集进行联合预训练,并能自动利用不同数据集的标注之间的联系,从而提升预训练效果。
-
公开(公告)号:CN117523560A
公开(公告)日:2024-02-06
申请号:CN202210940422.1
申请日:2022-07-29
Applicant: 华为云计算技术有限公司
IPC: G06V20/70 , G06V10/26 , G06V10/82 , G06N3/0455 , G06N3/08
Abstract: 本申请涉及一种语义分割方法、装置和存储介质。该方法可用于第一神经网络模型,该方法包括:获取待处理图像数据的第一图像特征数据;对第一图像特征数据进行特征增强,得到第一增强图像特征数据,第一增强图像特征数据包括图像内的上下文信息;利用第二图像特征数据对第一图像特征数据进行特征增强,得到第二增强图像特征数据,第二增强图像特征数据包括跨图像的上下文信息;根据第一增强图像特征数据和第二增强图像特征数据,确定待处理图像的预测掩码,预测掩码指示待处理图像的语义分割结果。根据本申请实施例,能够获得层次更丰富的特征信息,提高语义分割结果的准确性,可以得到更高效、迁移能力和性能更好的第一神经网络模型。
-
公开(公告)号:CN116310614A
公开(公告)日:2023-06-23
申请号:CN202111571041.2
申请日:2021-12-21
Applicant: 华为云计算技术有限公司
IPC: G06V10/774 , G06V10/764 , G06V10/82 , G06V10/26 , G06V20/70
Abstract: 本申请涉及一种基于多数据集的预训练方法、装置及存储介质,其中,所述方法包括:对第一样本图像进行跨数据集混合,得到第一目标图像,第一样本图像为训练集中的任一样本图像,训练集由多个数据集合并而成,每个数据集包括多个具有像素级标注信息的样本图像;对第一样本图像进行数据增强,得到第二目标图像;根据第一目标图像及第二目标图像,对第一特征提取网络进行预训练,第一特征提取网络应用于语义分割任务。本申请实施例的预训练基于像素级分类,与下游的语义分割任务之间不存在任务差距,从而能够提高语义分割模型在预训练阶段的性能。
-
-