-
公开(公告)号:CN118552659A
公开(公告)日:2024-08-27
申请号:CN202310132466.6
申请日:2023-02-17
Applicant: 华为云计算技术有限公司
IPC: G06T11/60 , G06T11/40 , G06N3/0464 , G06N3/0455 , G06N3/084 , G06N3/088
Abstract: 一种文本生成图像的方法、模型训练方法及装置,涉及人工智能领域,用于提高处理效率,提升生成图像的质量。本申请设计一种图像Token解码器,在预测图像的Token序列时,采用划分L型区块的方式,按照L型区块邻接的方式,按照顺序迭代解码各个L型区块包括的Token序列。由于下一个预测的L型区块与已预测的Token序列在空间上具有相关性,从而可以提高生成的图像质量。另外,无需每次都预测图像的所有图像块的Token,从而可以提高预测的效率。
-
公开(公告)号:CN118334325A
公开(公告)日:2024-07-12
申请号:CN202211711174.X
申请日:2022-12-29
Applicant: 华为云计算技术有限公司 , 香港理工大学
IPC: G06V10/26 , G06V10/764 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/045 , G06N3/08
Abstract: 一种数据处理方法及装置,该方法包括,第一设备获取第一数据,将第一数据输入训练后的任务模型,以得到任务模型输出的处理结果;任务模型包括预训练模型和至少一个提示模块,预训练模型被划分为多个模块,多个模块中每相邻两个模块与所述至少一个提示模块中的一个提示模块相对应;多个模块中排在起始位置的第一模块的输入数据包括第一数据,多个模块中排在第一模块之后的任意一个第二模块的输入数据是根据第二模块的前一个模块输出的处理结果和目标提示模块输出的修正因子确定的。该方法在不改变预训练模型的结构的基础上,利用修正因子更好地激发预训练模型迁移预训练知识来进行像素级别的语义标注,从而提高任务处理精度。
-
公开(公告)号:CN118052199A
公开(公告)日:2024-05-17
申请号:CN202211397731.5
申请日:2022-11-09
Applicant: 华为云计算技术有限公司 , 中国科学技术大学
IPC: G06F40/126 , G06F40/279
Abstract: 一种基于Transformer的编码方法,包括:获取第一文本的第一向量表示,通过n个串联的第一编码器对第一向量表示进行处理,得到第一编码结果;获取第二文本的第二向量表示,通过m个串联的第二编码器对第二向量表示进行处理,得到第二编码结果,在通过m个第二编码器中第i个第二编码器对第(i‑1)个第二编码器输出的结果处理时,通过n个第一编码器中第(i‑1)个第一编码器的输出结果进行辅助处理;对第一编码结果和第二编码结果进行拼接;通过g个串联的第三编码器对拼接得到的结果处理,输出处理结果。这样,对不同文本单独编码,并通过利用对第一文本编码的中间结果对第二文本进行辅助编码,扩大了第二文本低层的注意力范围,提升了编码结果的准确性。
-
公开(公告)号:CN117994554A
公开(公告)日:2024-05-07
申请号:CN202211350484.3
申请日:2022-10-31
Applicant: 华为云计算技术有限公司
IPC: G06V10/764
Abstract: 本申请提供一种识别方法、装置及相关设备,该方法包括:计算设备将待识别图像输入多个训练好的识别模型,其中,每个训练好的识别模型包括图像语言预训练模型和包括多个提示词的提示模板,各个训练好的识别模型的提示模板各不相同;计算设备基于多个训练好的识别模型确定待识别图像属于各个类别的概率,其中,第i个训练好的识别模型输出待识别图像属于第i个训练好的识别模型对应的多个类别的概率;最后根据待识别图像属于各个类别的概率,确定待识别图像的类别。通过将数据集进行分组,并通过视觉语言预训练模型和提示模板相结合的方式,训练用于未知类检测的模型,能够提高模型对闭集之外的未知类的检测精度,提高模型分类精度。
-
公开(公告)号:CN117876838A
公开(公告)日:2024-04-12
申请号:CN202211211337.8
申请日:2022-09-30
Applicant: 华为云计算技术有限公司
IPC: G06V10/82 , G06V10/80 , G06N3/0464 , G06N3/045 , G06N3/08
Abstract: 一种图像处理方法,包括:通过主干网络的前N个卷积层处理目标图像,获得浅层特征;根据浅层特征对目标图像中的业务对象进行强化处理,获得优化图像;通过主干网络处理优化图像,获得语义特征,该语义特征用于预测目标图像所属的子类或检索与目标图像属于相同子类的图像。由此,根据目标图像的浅层特征对目标图像中的业务对象进行强化处理,使得目标图像中有利于对目标图像执行细粒度图像处理任务的业务对象在优化图像中的特征更为显著,对主干网络可以起到提示作用,主干网络处理优化图像以得到的语义特征能够更加专注于业务对象的特征,进而可以根据目标图像的语义特征更加准确的预测目标图像所属的子类或检索与目标图像属于相同子类的图像。
-
公开(公告)号:CN117828323A
公开(公告)日:2024-04-05
申请号:CN202211193322.3
申请日:2022-09-28
Applicant: 华为云计算技术有限公司
IPC: G06F18/213 , G06N20/00
Abstract: 本申请涉及一种特征预测方法、装置和存储介质。该方法包括:获取待预测对象的历史数据以及预测单位时间,历史数据包括:待预测对象的类别特征以及类别特征对应的历史序列特征,历史序列特征表示针对类别特征的待预测对象在多个历史单位时间下采集的历史行为数据;根据历史数据以及预测单位时间进行特征预测,得到目标序列特征,目标特征序列表示类别特征的待预测对象在预测单位时间内的预测行为数据。根据本申请实施例,能够提高特征预测的便捷性和效率。
-
公开(公告)号:CN117473332A
公开(公告)日:2024-01-30
申请号:CN202210848576.8
申请日:2022-07-19
Applicant: 华为云计算技术有限公司
IPC: G06F18/22 , G06N3/0455 , G06N3/0464 , G06N3/08 , G06V20/70 , G06V10/82 , G06F40/30 , G06F16/583 , G06F16/532 , G06F16/332 , G06F16/33 , G06V10/764
Abstract: 本申请实施例公开一种数据的处理方法以及相关设备,该方法可用于人工智能领域中,方法包括:获取第一图像中每个图像区域的特征信息,第一图像包括多个图像块,每个图像区域包括至少两个相邻的图像块;获取第一文本中每个对象描述信息的特征信息,对象描述信息包括对象的类别;根据每个图像区域的特征信息和每个对象描述信息的特征信息,通过第一神经网络生成第一指示信息,第一指示信息指示任意一个图像区域和任意一个对象描述信息之间的相似度。在图像区域和对象描述信息这一粒度计算特征信息之间的相似度,更能准确的反映图像区域和对象描述信息在语义上的相似度,进而有利于准确反映图像的语义和文本的语义之间的关系。
-
公开(公告)号:CN117437440A
公开(公告)日:2024-01-23
申请号:CN202210801213.9
申请日:2022-07-08
Applicant: 华为云计算技术有限公司
IPC: G06V10/72 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/048 , G06N3/084
Abstract: 一种模型训练方法,应用于人工智能领域,能够提高模型的领域泛化能力。该方法中,模型在训练过程中基于输入图像的特征统计信息和其他域的图像的特征统计信息来预测输入图像所在域的特征统计信息,进而基于输入图像所在域的特征统计信息对输入图像进行处理。由于模型在预测特征统计信息的过程中,既考虑了输入图像与其他域的图像之间的共性,还结合了输入图像本身的特征分布独特性,因此模型能够有效地预测得到输入图像所在域的特征分布信息。这样一来,在模型学会预测输入图像所在域的特征分布的基础上,能够基于输入图像所在域的特征分布对输入图像进行处理,有效地提高了模型的领域泛化能力。
-
公开(公告)号:CN117333690A
公开(公告)日:2024-01-02
申请号:CN202210712315.3
申请日:2022-06-22
Applicant: 华为云计算技术有限公司
IPC: G06V10/764 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/045 , G06N3/0464 , G06N3/088 , G06N3/09
Abstract: 本申请实现方式公开了一种图像分类模型的训练方法,该方法包括:确定训练数据集,以及确定初始图像分类模型,训练数据集包括多个训练样本图像,初始图像分类模型包括第一初始图像分类模块,第一初始图像分类模块为基于全局注意力机制、且具备对长度可变的多图序列进行分类的能力的图像分类模块,多图序列为包括多个图像的图像序列;根据训练数据集,以及预设的用于图像分类的分类向量,对初始图像分类模型进行模型训练,得到初始图像分类模型对应的目标图像分类模型。如此,得到的目标图像分类模型可以实现对长度可变的多图序列的图像分类,并且提高了图像识别效果和图像分类精确度。本申请实现方式还公开了一种图像分类方法和计算设备集群。
-
公开(公告)号:CN116796760A
公开(公告)日:2023-09-22
申请号:CN202210244066.X
申请日:2022-03-11
Applicant: 华为云计算技术有限公司
IPC: G06F40/58 , G06F40/205 , G06F40/30 , G06F18/214 , G06F40/189
Abstract: 本申请提供一种翻译系统及其训练、应用方法与相关设备,该翻译系统包括第一语言模型和第二语言模型,第一语言模型包括第一编码器、第一对齐编码器、第一对齐解码器和第一解码器,第二语言模型包括第二编码器、第二对齐编码器、第二对齐解码器和第二解码器,通过平行语料对所述第一语言模型和所述第二语言模型进行训练,得到训练好的所述第一语言模型和所述第二语言模型;通过对训练好的第一语言模型和第二语言模型中的编码器和解码器进行组合,即可实现第一语言和第二语言之间的相互翻译。通过使用本申请提供的翻译系统,能够提高翻译系统的训练效率,节约计算资源,并能够提高翻译系统的可扩展性。
-
-
-
-
-
-
-
-
-