-
公开(公告)号:CN117315334A
公开(公告)日:2023-12-29
申请号:CN202311161247.7
申请日:2023-09-08
Applicant: 北京百度网讯科技有限公司
IPC: G06V10/764 , G06V10/82 , G06V10/762 , G06N3/0455 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本公开提供了图像分类方法、深度学习模型的训练方法、装置、电子设备、存储介质以及程序产品,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习、大模型等技术领域,可应用于图像处理等场景。具体实现方案为:对待处理图像进行特征提取,得到图像特征;对图像特征进行聚类,得到图像聚类标记特征;基于图像聚类标记特征和任务提示标记特征,得到文本提示特征,任务提示标记特征用于表征与图像分类任务相关的知识;以及基于文本提示特征和待处理图像,得到待处理图像的图像分类结果。
-
公开(公告)号:CN115761437A
公开(公告)日:2023-03-07
申请号:CN202211400729.9
申请日:2022-11-09
Applicant: 北京百度网讯科技有限公司
IPC: G06V10/82 , G06V10/26 , G06V10/774 , G06V10/762 , G06V10/80
Abstract: 本公开提供了一种基于视觉转换器的图像处理方法、训练方法和电子设备,涉及人工智能技术领域,具体为深度学习、图像处理、计算机视觉技术领域,可应用于OCR等场景。该方法包括:确定待处理图像的多个原图像标记;通过视觉转换器模型,将所述多个原图像标记拆分成至少两个重要图像标记和至少两个次要图像标记;通过所述视觉转换器模型,对所述至少两个重要图像标记进行聚合得到新的重要图像标记,并对所述至少两个次要图像标记进行聚合得到新的次要图像标记;通过所述视觉转换器模型,根据所述新的重要图像标记和所述新的次要图像标记进行图像处理,得到图像处理结果。通过上述技术方案能够提高图像处理的准确性。
-
公开(公告)号:CN117315334B
公开(公告)日:2025-03-28
申请号:CN202311161247.7
申请日:2023-09-08
Applicant: 北京百度网讯科技有限公司
IPC: G06V10/764 , G06V10/82 , G06V10/762 , G06N3/0455 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本公开提供了图像分类方法、深度学习模型的训练方法、装置、电子设备、存储介质以及程序产品,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习、大模型等技术领域,可应用于图像处理等场景。具体实现方案为:对待处理图像进行特征提取,得到图像特征;对图像特征进行聚类,得到图像聚类标记特征;基于图像聚类标记特征和任务提示标记特征,得到文本提示特征,任务提示标记特征用于表征与图像分类任务相关的知识;以及基于文本提示特征和待处理图像,得到待处理图像的图像分类结果。
-
公开(公告)号:CN115761437B
公开(公告)日:2024-02-06
申请号:CN202211400729.9
申请日:2022-11-09
Applicant: 北京百度网讯科技有限公司
IPC: G06V10/82 , G06V10/26 , G06V10/774 , G06V10/762 , G06V10/80
Abstract: 本公开提供了一种基于视觉转换器的图像处理方法、训练方法和电子设备,涉及人工智能技术领域,具体为深度学习、图像处理、计算机视觉技术领域,可应用于OCR等场景。该方法包括:确定待处理图像的多个原图像标记;通过视觉转换器模型,将所述多个原图像标记拆分成至少两个重要图像标记和至少两个次要图像标记;通过所述视觉转换器模型,对所述至少两个重要图像标记进行聚合得到新的重要图像标记,并对所述至少两个次要图像标记进行聚合得到新的次要图像标记;通过所述视觉转换器模型,根据所述新的重要图像标记和所述新的次要图像标记进行图像处理,得到图像处理结果。通过上述技术方案能够提高图像处理的准确性。
-
-
-