一种基于属性语义相似匹配的行人属性识别方法

    公开(公告)号:CN119964204A

    公开(公告)日:2025-05-09

    申请号:CN202510150928.6

    申请日:2025-02-11

    Applicant: 厦门大学

    Abstract: 一种基于属性语义相似匹配的行人属性识别方法,涉及计算机视觉技术领域。首先设计一个自适应的语义查询模块,使用与视觉特征结合的自适应查询来学习特定于属性的空间分布,并捕获每个属性的语义信息。此外,将行人属性识别重构为语义匹配任务,使用属性文本特征作为语义锚点,根据查询的语义信息与锚点间的距离来预测行人属性。最后,提出动态负语义学习策略,通过将属性的空间先验信息与可学习参数相结合,来生成属性的负语义信息,以约束语义查询模块对属性的关注区域,实现更加准确的行人属性识别。

    一种面向长尾异构数据的联邦学习方法

    公开(公告)号:CN114429219B

    公开(公告)日:2025-02-11

    申请号:CN202111502142.4

    申请日:2021-12-09

    Abstract: 本发明公开了一种面向长尾异构数据的联邦学习方法包括如下步骤:步骤一、服务器端随机初始化全局模型w并将模型参数发给各个客户端,各个客户端利用收到的模型参数进行模型更新,并将更新后的模型参数上传至服务器端;步骤二、服务器端对收到的本地模型参数后进行聚合得到教师模型和学生模型;步骤三、服务器端对步骤二中得到的教师模型进行校准,让教师模型在无偏知识上进行学习,以此教出好的学生模型;步骤四、使用知识蒸馏将教师模型的无偏知识传递给学生模型,随后将学生模型发给各个客户端开始下一轮联邦训练。

    一种结合视觉-语言预训练和提示学习的域泛化方法

    公开(公告)号:CN118607591A

    公开(公告)日:2024-09-06

    申请号:CN202410736279.3

    申请日:2024-06-07

    Applicant: 厦门大学

    Abstract: 本发明公开了一种结合视觉‑语言预训练和提示学习的域泛化方法。所述方法基于一训练完成的多模态模型以及植入该模型的至少一个域提示生成器,所述多模态模型包括至少一个图像编码器、至少一个文本编码器;获取多域文本数据集及多域图像数据集,并利用模型从多域文本数据集提取每条文本数据对应的第一文本特征,以及,从多域图像数据集提取每张图像数据对应的第一图像特征;在图像编码器中嵌入可学习向量,并利用嵌入后的图像编码器提取多域图像数据集中每张图像数据对应的第二图像特征;将每张图像数据对应的第二图像特征输入域提示生成器,得到每个域对应的总体语言提示等。本发明能够提高模型在未见领域的准确性和效率,解决现有技术中存在的问题。

    一种基于元学习的不平衡数据联邦学习方法和系统

    公开(公告)号:CN116628543A

    公开(公告)日:2023-08-22

    申请号:CN202310452512.0

    申请日:2023-04-25

    Abstract: 本发明公开了一种基于元学习的不平衡数据联邦学习方法和系统,包括:客户端接收服务端下发的赋权模型参数和全局模型参数,利用本地数据和赋权模型参数得到用作校正数据不平衡的权重,基于权重、本地数据以及全局模型参数更新本地模型参数,其中,赋权模型参数包括类赋权模型参数、样本赋权模型参数,对应的权重包括类权重和样本权重;服务端接收客户端上传的本地模型参数并聚合得到全局模型参数,利用元数据、赋权模型参数以及聚合的全局模型参数得到元全局模型参数,利用元全局模型参数和元数据来更新赋权模型参数,更新的赋权模型参数和聚合的全局模型参数下发至客户端进行下一轮联邦学习。

    一种基于循环上下文聚合网络的单图像去雾方法

    公开(公告)号:CN112132761B

    公开(公告)日:2023-07-14

    申请号:CN202010972204.7

    申请日:2020-09-16

    Applicant: 厦门大学

    Abstract: 一种基于循环上下文聚合网络的单图像去雾方法,涉及计算机视觉技术。步骤:A.准备训练样本集(xi,yi),i=1,……,N,N为训练样本数,N为自然数。xi表示训练样本对应的固定大小的图像。yi表示训练样本xi对应的真实图像;B.预处理训练样本集;C.设计循环上下文聚合网络结构;D.设计上下文聚合块;E.在循环上下文聚合网络里,采用循环跳跃连接,避免训练中出现梯度爆炸或者梯度消失问题,加速循环网络的训练。建立深度网络框架,包括编码模块、循环模块、解码模块;可有效进行单图像去雾,通过算法分析,不仅大大提高了去雾的性能,而且还保存着图像的纹理和细节,在视觉上也取得最好的效果。

    一种基于内外语义聚合的视频目标检测方法

    公开(公告)号:CN112966581B

    公开(公告)日:2022-05-27

    申请号:CN202110213113.X

    申请日:2021-02-25

    Applicant: 厦门大学

    Abstract: 一种基于内外语义聚合的视频目标检测方法,涉及计算机视觉技术。包括步骤:A.准备训练样本集,依次包括当前帧、支持帧,首先在当前序列随机选取一帧作为当前帧,再在当前帧附近随机选取几帧作为支持帧,为当前帧的训练提供丰富的时空信息。B.预处理训练样本集,对当前帧,支持帧进行随机翻转、裁剪等操作,进一步增大训练样本多样性。C.在每帧内进行内部语义聚合,实现单个帧自身的空间语义增强。D.联合三帧进行外部语义聚合,实现三帧时空信息的语义增强。E.对经过内外语义聚合的当前帧特征进行分类和回归,得到最后的检测结果,包括检测框和预测所属类别。可以有效地聚合视频中的时空语义信息,从而有效地提高目标检测器的性能。

    一种面向长尾异构数据的联邦学习方法

    公开(公告)号:CN114429219A

    公开(公告)日:2022-05-03

    申请号:CN202111502142.4

    申请日:2021-12-09

    Abstract: 本发明公开了一种面向长尾异构数据的联邦学习方法包括如下步骤:步骤一、服务器端随机初始化全局模型w并将模型参数发给各个客户端,各个客户端利用收到的模型参数进行模型更新,并将更新后的模型参数上传至服务器端;步骤二、服务器端对收到的本地模型参数后进行聚合得到教师模型和学生模型;步骤三、服务器端对步骤二中得到的教师模型进行校准,让教师模型在无偏知识上进行学习,以此教出好的学生模型;步骤四、使用知识蒸馏将教师模型的无偏知识传递给学生模型,随后将学生模型发给各个客户端开始下一轮联邦训练。

    基于统一中间模态的跨模态行人重识别方法

    公开(公告)号:CN113903053A

    公开(公告)日:2022-01-07

    申请号:CN202111129224.9

    申请日:2021-09-26

    Applicant: 厦门大学

    Abstract: 基于统一中间模态的跨模态行人重识别方法,涉及计算机视觉技术领域。包括以下步骤:1)将两种模态图像分别输入到两个编码器中进行编码;2)将编码得到的两种特征输入到两个非线性激活函数中用于加深其非线性表达能力;3)将非线性激活后的两种特征输入到一个共享的解码器中,并解码到一个统一的中间图像空间中,得到中间模态图像;4)将得到的中间模态图像与原始图像一起输入到网络中进行优化,完成跨模态行人重识别。可降低模态差异,进一步地拉近两种中间模态图像之间的距离,提升跨模态行人重识别模型的性能。

    基于自适应深度度量学习的遮挡行人重识别方法

    公开(公告)号:CN108960127B

    公开(公告)日:2021-11-05

    申请号:CN201810696880.9

    申请日:2018-06-29

    Applicant: 厦门大学

    Abstract: 基于自适应深度度量学习的遮挡行人重识别方法,涉及计算机视觉技术。首先设计对遮挡鲁棒的卷积神经网络结构,在网络中先提取行人图像的中低层语义特征;然后提取对遮挡鲁棒的局部特征,并联合全局特征,再学习高层语义特征,并且使用自适应近邻的深度度量损失学习对于行人身份变化足够具有判别力的特征,并联合使用分类损失,快速稳定地完成整个网络的更新学习;最后根据训练好的网络模型,对测试图像提取第一个全连接层的输出作为特征表示,并完成后续的特征相似度比较和排序,得到最后的行人重识别结果。有效地提高特征对遮挡的鲁棒性。

Patent Agency Ranking