-
公开(公告)号:CN114724090B
公开(公告)日:2022-08-30
申请号:CN202210559553.5
申请日:2022-05-23
Applicant: 北京百度网讯科技有限公司
IPC: G06V20/52 , G06V10/74 , G06V10/762 , G06V10/774 , G06K9/62
Abstract: 本公开提供了一种行人再识别模型的训练方法、行人再识别方法及装置,涉及人工智能技术领域,尤其涉及深度学习、计算机视觉、图像处理技术,可应用于智慧城市、智能交通等场景。该方法包括:将原始样本集中的原始样本图像分别输入初始行人再识别模型,得到原始样本图像的第一样本特征;对原始样本图像的第一样本特征进行聚类,得到多个聚类簇;根据原始样本图像的第一样本特征生成原始样本图像对应的难正样本的第二样本特征;基于第一样本特征、第二样本特征和聚类簇,更新初始行人再识别模型。该方法提高了行人再识别模型的识别结果的准确性。
-
公开(公告)号:CN118506131A
公开(公告)日:2024-08-16
申请号:CN202410931136.8
申请日:2024-07-11
Applicant: 北京百度网讯科技有限公司
IPC: G06V10/774
Abstract: 本公开提供了一种图像生成方法、装置、电子设备及存储介质,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习、大模型等技术领域,可应用于AIGC基于人工智能的内容生成等场景。具体实现方案为:根据噪声数据、背景图像、掩码图像和文本,确定中间特征图;其中,掩码图像包括位置信息,位置信息指示了掩码图像是否包含待生成对象;文本包括N个待生成对象的对象类别,N是大于等于1的整数;根据掩码图像中的位置信息,基于与位置信息对中间特征图进行处理,得到处理后特征图;以及根据处理后特征图,生成目标图像;其中,目标图像中的背景与背景图像一致,目标图像中前景对象的类别与文本中的对象类别一致。
-
公开(公告)号:CN115578613A
公开(公告)日:2023-01-06
申请号:CN202211272814.1
申请日:2022-10-18
Applicant: 北京百度网讯科技有限公司
IPC: G06V10/774 , G06V10/82 , G06V10/62 , G06V20/52
Abstract: 本公开提供了目标再识别模型的训练方法和目标再识别方法,涉及人工智能技术领域,具体为深度学习、图像处理、计算机视觉技术领域,可应用于人脸识别、智慧城市等场景。具体实现方案为:基于图像样本集合,确定预训练的转换器模型输出的多个第一特征图和待训练的卷积神经网络模型输出的多个第二特征图;根据多个第一特征图和多个第二特征图,利用第一知识蒸馏损失函数,确定第一蒸馏损失值;利用第二知识蒸馏损失函数,确定第二蒸馏损失值;根据第一蒸馏损失值和第二蒸馏损失值,对待训练的卷积神经网络模型进行训练,以得到可进行目标再识别的卷积神经网络模型。本公开的技术方案,可以训练得到推理速度和识别性能更好的卷积神经网络模型。
-
公开(公告)号:CN115273148B
公开(公告)日:2023-09-05
申请号:CN202210926650.3
申请日:2022-08-03
Applicant: 北京百度网讯科技有限公司
IPC: G06V40/10 , G06V10/762 , G06N20/00
Abstract: 本公开提供了一种行人重识别模型训练方法、装置、电子设备及存储介质,涉及人工智能技术领域,具体涉及图像处理、计算机视觉和深度学习等技术领域,尤其涉及目标检测、智能交通等场景。该方法包括:确定图像样本在当前时刻所属的当前聚类簇,并确定当前聚类簇在当前时刻的聚类伪标签;并根据先前聚类簇和当前聚类簇确定先前聚类簇在当前时刻的传递伪标签;根据图像样本所属的当前聚类簇在当前时刻的聚类伪标签和图像样本所属的先前聚类簇在当前时刻的传递伪标签,确定图像样本在当前时刻的融合伪标签;采用图像样本在当前时刻的融合伪标签进行模型训练,得到当前时刻的行人重识别模型。通过上述技术方案能够提高图像样本的标签质量。
-
公开(公告)号:CN114724090A
公开(公告)日:2022-07-08
申请号:CN202210559553.5
申请日:2022-05-23
Applicant: 北京百度网讯科技有限公司
IPC: G06V20/52 , G06V10/74 , G06V10/762 , G06V10/774 , G06K9/62
Abstract: 本公开提供了一种行人再识别模型的训练方法、行人再识别方法及装置,涉及人工智能技术领域,尤其涉及深度学习、计算机视觉、图像处理技术,可应用于智慧城市、智能交通等场景。该方法包括:将原始样本集中的原始样本图像分别输入初始行人再识别模型,得到原始样本图像的第一样本特征;对原始样本图像的第一样本特征进行聚类,得到多个聚类簇;根据原始样本图像的第一样本特征生成原始样本图像对应的难正样本的第二样本特征;基于第一样本特征、第二样本特征和聚类簇,更新初始行人再识别模型。该方法提高了行人再识别模型的识别结果的准确性。
-
公开(公告)号:CN116629315B
公开(公告)日:2024-02-20
申请号:CN202310587190.0
申请日:2023-05-23
Applicant: 北京百度网讯科技有限公司
IPC: G06N3/0455 , G06N3/0895 , G06N3/084 , G06T9/00 , G06V10/82 , G06V10/44
Abstract: 本公开提供了一种感知模型的训练方法、装置、设备和介质,涉及计算机视觉、图像处理和深度学习等技术领域,可应用于元宇宙和智慧城市等场景。具体实现方案为:采用包括目标对象的第一图像对预定编码网络进行训练;以及基于经训练的编码网络,得到感知模型;进行训练的过程包括:对第一图像进行掩码处理,得到包括第一掩码图像块和第一非掩码图像块的第一预处理图像;采用预训练图像处理模型对第一预处理图像进行处理,得到第一掩码特征和第一非掩码特征;采用预定编码网络对第一非掩码图像块进行编码,得到第二非掩码特征;基于第二非掩码特征重构得到第二掩码特征;以及根据两个非掩码特征之间的差异,以及两个掩码特征之间的差异进行训练。
-
公开(公告)号:CN116629315A
公开(公告)日:2023-08-22
申请号:CN202310587190.0
申请日:2023-05-23
Applicant: 北京百度网讯科技有限公司
IPC: G06N3/0455 , G06N3/0895 , G06N3/084 , G06T9/00 , G06V10/82 , G06V10/44
Abstract: 本公开提供了一种感知模型的训练方法、装置、设备和介质,涉及计算机视觉、图像处理和深度学习等技术领域,可应用于元宇宙和智慧城市等场景。具体实现方案为:采用包括目标对象的第一图像对预定编码网络进行训练;以及基于经训练的编码网络,得到感知模型;进行训练的过程包括:对第一图像进行掩码处理,得到包括第一掩码图像块和第一非掩码图像块的第一预处理图像;采用预训练图像处理模型对第一预处理图像进行处理,得到第一掩码特征和第一非掩码特征;采用预定编码网络对第一非掩码图像块进行编码,得到第二非掩码特征;基于第二非掩码特征重构得到第二掩码特征;以及根据两个非掩码特征之间的差异,以及两个掩码特征之间的差异进行训练。
-
公开(公告)号:CN118823184A
公开(公告)日:2024-10-22
申请号:CN202410868648.4
申请日:2024-06-28
Applicant: 北京百度网讯科技有限公司
IPC: G06T11/60 , G06F40/30 , G06F40/284 , G06N3/045 , G06N3/0464
Abstract: 本公开提供了一种图像生成、大模型的训练、图像处理方法及装置、设备和介质,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习、大模型等技术领域,可应用于AIGC、人机交互等场景。该图像生成方法包括:获取编辑文本和经加噪处理的原始图像,编辑文本用于指示针对目标对象的编辑操作,经加噪处理的原始图像未包括目标对象;分别对编辑文本和经加噪处理的原始图像进行特征提取处理,得到文本特征和图像特征,文本特征包括至少一个词向量;根据文本特征和图像特征,确定至少一个词向量各自的特征图;根据至少一个词向量各自的特征图,生成编辑图像,编辑图像包括目标对象。
-
公开(公告)号:CN115578613B
公开(公告)日:2024-03-08
申请号:CN202211272814.1
申请日:2022-10-18
Applicant: 北京百度网讯科技有限公司
IPC: G06V10/774 , G06V10/82 , G06V10/62 , G06V20/52
-
公开(公告)号:CN115273148A
公开(公告)日:2022-11-01
申请号:CN202210926650.3
申请日:2022-08-03
Applicant: 北京百度网讯科技有限公司
IPC: G06V40/10 , G06V10/762 , G06N20/00
Abstract: 本公开提供了一种行人重识别模型训练方法、装置、电子设备及存储介质,涉及人工智能技术领域,具体涉及图像处理、计算机视觉和深度学习等技术领域,尤其涉及目标检测、智能交通等场景。该方法包括:确定图像样本在当前时刻所属的当前聚类簇,并确定当前聚类簇在当前时刻的聚类伪标签;并根据先前聚类簇和当前聚类簇确定先前聚类簇在当前时刻的传递伪标签;根据图像样本所属的当前聚类簇在当前时刻的聚类伪标签和图像样本所属的先前聚类簇在当前时刻的传递伪标签,确定图像样本在当前时刻的融合伪标签;采用图像样本在当前时刻的融合伪标签进行模型训练,得到当前时刻的行人重识别模型。通过上述技术方案能够提高图像样本的标签质量。
-
-
-
-
-
-
-
-
-