一种基于深度学习的细粒度图像检索方法

    公开(公告)号:CN119988667A

    公开(公告)日:2025-05-13

    申请号:CN202510086534.9

    申请日:2025-01-20

    Inventor: 雷建军 余强

    Abstract: 本发明属于计算机视觉技术领域,涉及一种基于深度学习的细粒度图像检索方法,包括:获取待检索的图像数据;对图像数据进行预处理,将预处理后的图像输入到细粒度图像检索模型中,得到检索结果;其中细粒度图像检索模型包括ViT模型、Token筛选模块、中值增强空间通道注意力模块以及语义信息融合模块;ViT模型用于将图像划分为固定大小的patch序列;Token筛选模块模块用于对patch序列进行处理,得到高层语义特征表示;中值增强空间通道注意力模块用于对patch序列进行特征提取,得到中低层细节特征表示;语义信息融合模块用于对高层语义特征表示和中低层细节特征表示进行融合;本发明通过将ViT模型引入到图像检索任务中,并针对ViT模型中的token提出了独特的token增强选取方法,提升了模型对图像高层语义的表示能力。

    一种基于机器视觉的供车站应用的垃圾分类系统及方法

    公开(公告)号:CN117011585A

    公开(公告)日:2023-11-07

    申请号:CN202310690031.3

    申请日:2023-06-12

    Abstract: 本发明涉及一种基于机器视觉的供车站应用的垃圾分类系统及方法,属于垃圾分类技术领域。该系统包括前端垃圾分类装置和后端云服务平台;所述后端云服务平台包括云数据平台和云计算平台;所述前端垃圾分类装置用于采集和识别垃圾图像,根据识别结果进行显示和语音播报,并控制垃圾桶进行开关控制;同时,结合传感器技术,实现垃圾桶内烟雾预警、桶满检测,以及人体接近检测和灯管补光控制;本发明设计了基于手持垃圾数据增强的方式,使得初始训练的样本数据更加符合实际情况,能提高识别算法的鲁棒性。同时,考虑到垃圾种类繁多,算法存在误判的可能性,本发明采用增量学习定期对垃圾分类算法进行更新,以保证垃圾分类算法的准确性。

Patent Agency Ranking