Patent search ap:("北京百度网讯科技有限公司") AND inv:"张欣彧" Page 1

1.

发明授权
行人再识别模型的训练方法、行人再识别方法及装置有权

公开(公告)号：CN114724090B

公开(公告)日：2022-08-30

申请号：CN202210559553.5

申请日：2022-05-23

Applicant: 北京百度网讯科技有限公司

Inventor： 张欣彧 , 王之港 , 王健 , 孙昊 , 丁二锐

IPC: G06V20/52 , G06V10/74 , G06V10/762 , G06V10/774 , G06K9/62

Abstract: 本公开提供了一种行人再识别模型的训练方法、行人再识别方法及装置，涉及人工智能技术领域，尤其涉及深度学习、计算机视觉、图像处理技术，可应用于智慧城市、智能交通等场景。该方法包括：将原始样本集中的原始样本图像分别输入初始行人再识别模型，得到原始样本图像的第一样本特征；对原始样本图像的第一样本特征进行聚类，得到多个聚类簇；根据原始样本图像的第一样本特征生成原始样本图像对应的难正样本的第二样本特征；基于第一样本特征、第二样本特征和聚类簇，更新初始行人再识别模型。该方法提高了行人再识别模型的识别结果的准确性。

2.

发明公开
图像生成方法、装置、电子设备及存储介质审中-实审

公开(公告)号：CN118506131A

公开(公告)日：2024-08-16

申请号：CN202410931136.8

申请日：2024-07-11

Applicant: 北京百度网讯科技有限公司

Inventor： 王晓迪 , 张欣彧 , 陈金文

IPC: G06V10/774

Abstract: 本公开提供了一种图像生成方法、装置、电子设备及存储介质，涉及人工智能技术领域，尤其涉及计算机视觉、深度学习、大模型等技术领域，可应用于AIGC基于人工智能的内容生成等场景。具体实现方案为：根据噪声数据、背景图像、掩码图像和文本，确定中间特征图；其中，掩码图像包括位置信息，位置信息指示了掩码图像是否包含待生成对象；文本包括N个待生成对象的对象类别，N是大于等于1的整数；根据掩码图像中的位置信息，基于与位置信息对中间特征图进行处理，得到处理后特征图；以及根据处理后特征图，生成目标图像；其中，目标图像中的背景与背景图像一致，目标图像中前景对象的类别与文本中的对象类别一致。

3.

发明公开
目标再识别模型的训练方法和目标再识别方法有权

公开(公告)号：CN115578613A

公开(公告)日：2023-01-06

申请号：CN202211272814.1

申请日：2022-10-18

Applicant: 北京百度网讯科技有限公司

Inventor： 张欣彧 , 王健 , 冯浩城

IPC: G06V10/774 , G06V10/82 , G06V10/62 , G06V20/52

Abstract: 本公开提供了目标再识别模型的训练方法和目标再识别方法，涉及人工智能技术领域，具体为深度学习、图像处理、计算机视觉技术领域，可应用于人脸识别、智慧城市等场景。具体实现方案为：基于图像样本集合，确定预训练的转换器模型输出的多个第一特征图和待训练的卷积神经网络模型输出的多个第二特征图；根据多个第一特征图和多个第二特征图，利用第一知识蒸馏损失函数，确定第一蒸馏损失值；利用第二知识蒸馏损失函数，确定第二蒸馏损失值；根据第一蒸馏损失值和第二蒸馏损失值，对待训练的卷积神经网络模型进行训练，以得到可进行目标再识别的卷积神经网络模型。本公开的技术方案，可以训练得到推理速度和识别性能更好的卷积神经网络模型。

4.

发明授权
行人重识别模型训练方法、装置、电子设备及存储介质有权

公开(公告)号：CN115273148B

公开(公告)日：2023-09-05

申请号：CN202210926650.3

申请日：2022-08-03

Applicant: 北京百度网讯科技有限公司

Inventor： 张欣彧 , 王健 , 孙昊 , 丁二锐

IPC: G06V40/10 , G06V10/762 , G06N20/00

Abstract: 本公开提供了一种行人重识别模型训练方法、装置、电子设备及存储介质，涉及人工智能技术领域，具体涉及图像处理、计算机视觉和深度学习等技术领域，尤其涉及目标检测、智能交通等场景。该方法包括：确定图像样本在当前时刻所属的当前聚类簇，并确定当前聚类簇在当前时刻的聚类伪标签；并根据先前聚类簇和当前聚类簇确定先前聚类簇在当前时刻的传递伪标签；根据图像样本所属的当前聚类簇在当前时刻的聚类伪标签和图像样本所属的先前聚类簇在当前时刻的传递伪标签，确定图像样本在当前时刻的融合伪标签；采用图像样本在当前时刻的融合伪标签进行模型训练，得到当前时刻的行人重识别模型。通过上述技术方案能够提高图像样本的标签质量。

5.

发明公开
行人再识别模型的训练方法、行人再识别方法及装置有权

公开(公告)号：CN114724090A

公开(公告)日：2022-07-08

申请号：CN202210559553.5

申请日：2022-05-23

Applicant: 北京百度网讯科技有限公司

Inventor： 张欣彧 , 王之港 , 王健 , 孙昊 , 丁二锐

IPC: G06V20/52 , G06V10/74 , G06V10/762 , G06V10/774 , G06K9/62

Abstract: 本公开提供了一种行人再识别模型的训练方法、行人再识别方法及装置，涉及人工智能技术领域，尤其涉及深度学习、计算机视觉、图像处理技术，可应用于智慧城市、智能交通等场景。该方法包括：将原始样本集中的原始样本图像分别输入初始行人再识别模型，得到原始样本图像的第一样本特征；对原始样本图像的第一样本特征进行聚类，得到多个聚类簇；根据原始样本图像的第一样本特征生成原始样本图像对应的难正样本的第二样本特征；基于第一样本特征、第二样本特征和聚类簇，更新初始行人再识别模型。该方法提高了行人再识别模型的识别结果的准确性。

6.

发明授权
感知模型的训练方法、装置、设备和介质有权

公开(公告)号：CN116629315B

公开(公告)日：2024-02-20

申请号：CN202310587190.0

申请日：2023-05-23

Applicant: 北京百度网讯科技有限公司

Inventor： 张欣彧 , 王健 , 姚锟 , 丁二锐 , 王井东

IPC: G06N3/0455 , G06N3/0895 , G06N3/084 , G06T9/00 , G06V10/82 , G06V10/44

Abstract: 本公开提供了一种感知模型的训练方法、装置、设备和介质，涉及计算机视觉、图像处理和深度学习等技术领域，可应用于元宇宙和智慧城市等场景。具体实现方案为：采用包括目标对象的第一图像对预定编码网络进行训练；以及基于经训练的编码网络，得到感知模型；进行训练的过程包括：对第一图像进行掩码处理，得到包括第一掩码图像块和第一非掩码图像块的第一预处理图像；采用预训练图像处理模型对第一预处理图像进行处理，得到第一掩码特征和第一非掩码特征；采用预定编码网络对第一非掩码图像块进行编码，得到第二非掩码特征；基于第二非掩码特征重构得到第二掩码特征；以及根据两个非掩码特征之间的差异，以及两个掩码特征之间的差异进行训练。

7.

发明公开
感知模型的训练方法、装置、设备和介质审中-实审

公开(公告)号：CN116629315A

公开(公告)日：2023-08-22

申请号：CN202310587190.0

申请日：2023-05-23

Applicant: 北京百度网讯科技有限公司

Inventor： 张欣彧 , 王健 , 姚锟 , 丁二锐 , 王井东

IPC: G06N3/0455 , G06N3/0895 , G06N3/084 , G06T9/00 , G06V10/82 , G06V10/44

Abstract: 本公开提供了一种感知模型的训练方法、装置、设备和介质，涉及计算机视觉、图像处理和深度学习等技术领域，可应用于元宇宙和智慧城市等场景。具体实现方案为：采用包括目标对象的第一图像对预定编码网络进行训练；以及基于经训练的编码网络，得到感知模型；进行训练的过程包括：对第一图像进行掩码处理，得到包括第一掩码图像块和第一非掩码图像块的第一预处理图像；采用预训练图像处理模型对第一预处理图像进行处理，得到第一掩码特征和第一非掩码特征；采用预定编码网络对第一非掩码图像块进行编码，得到第二非掩码特征；基于第二非掩码特征重构得到第二掩码特征；以及根据两个非掩码特征之间的差异，以及两个掩码特征之间的差异进行训练。

8.

发明公开
图像生成、大模型的训练、图像处理方法及装置、设备和介质审中-实审

公开(公告)号：CN118823184A

公开(公告)日：2024-10-22

申请号：CN202410868648.4

申请日：2024-06-28

Applicant: 北京百度网讯科技有限公司

Inventor： 张欣彧 , 王晓迪 , 岳海潇 , 张刚 , 姚锟 , 丁二锐

IPC: G06T11/60 , G06F40/30 , G06F40/284 , G06N3/045 , G06N3/0464

Abstract: 本公开提供了一种图像生成、大模型的训练、图像处理方法及装置、设备和介质，涉及人工智能技术领域，尤其涉及计算机视觉、深度学习、大模型等技术领域，可应用于AIGC、人机交互等场景。该图像生成方法包括：获取编辑文本和经加噪处理的原始图像，编辑文本用于指示针对目标对象的编辑操作，经加噪处理的原始图像未包括目标对象；分别对编辑文本和经加噪处理的原始图像进行特征提取处理，得到文本特征和图像特征，文本特征包括至少一个词向量；根据文本特征和图像特征，确定至少一个词向量各自的特征图；根据至少一个词向量各自的特征图，生成编辑图像，编辑图像包括目标对象。

9.

发明授权
目标再识别模型的训练方法和目标再识别方法有权

公开(公告)号：CN115578613B

公开(公告)日：2024-03-08

申请号：CN202211272814.1

申请日：2022-10-18

Applicant: 北京百度网讯科技有限公司

Inventor： 张欣彧 , 王健 , 冯浩城

IPC: G06V10/774 , G06V10/82 , G06V10/62 , G06V20/52

10.

发明公开
行人重识别模型训练方法、装置、电子设备及存储介质有权

公开(公告)号：CN115273148A

公开(公告)日：2022-11-01

申请号：CN202210926650.3

申请日：2022-08-03

Applicant: 北京百度网讯科技有限公司

Inventor： 张欣彧 , 王健 , 孙昊 , 丁二锐

IPC: G06V40/10 , G06V10/762 , G06N20/00

Abstract: 本公开提供了一种行人重识别模型训练方法、装置、电子设备及存储介质，涉及人工智能技术领域，具体涉及图像处理、计算机视觉和深度学习等技术领域，尤其涉及目标检测、智能交通等场景。该方法包括：确定图像样本在当前时刻所属的当前聚类簇，并确定当前聚类簇在当前时刻的聚类伪标签；并根据先前聚类簇和当前聚类簇确定先前聚类簇在当前时刻的传递伪标签；根据图像样本所属的当前聚类簇在当前时刻的聚类伪标签和图像样本所属的先前聚类簇在当前时刻的传递伪标签，确定图像样本在当前时刻的融合伪标签；采用图像样本在当前时刻的融合伪标签进行模型训练，得到当前时刻的行人重识别模型。通过上述技术方案能够提高图像样本的标签质量。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification