通过无监督域适应训练目标域分类模型的方法

    公开(公告)号:CN110880019B

    公开(公告)日:2022-07-12

    申请号:CN201911045261.4

    申请日:2019-10-30

    Abstract: 本发明公开了一种通过无监督域适应训练目标域分类模型的方法,包括:对于源域和目标域输入的批图像数据,通过标准卷积网络来提取特征,然后结合初始化设定的质心特征构建对应于源域和目标域的实例图;实例图中的节点矩阵依次通过源域分类器与图卷积网络后,生成对应于源域和目标域的类别质心特征;使用类别质心对齐机制,约束图卷积网络每层中来自不同域的类别质心,使不同域的类别质心随着迭代训练而逐渐靠近;并且,使用质心指导的对抗性对齐机制,利用所有类别自动生成的质心作为域全局统计信息指导每批图像数据参与对抗训练;通过迭代训练最终得到在目标域有效的分类模型。上述方法具有很好的泛化性,且训练好的分类模型分类准确较高。

    基于动态原型学习的小样本视频目标分割方法

    公开(公告)号:CN114638839A

    公开(公告)日:2022-06-17

    申请号:CN202210536170.6

    申请日:2022-05-18

    Abstract: 本发明公开了一种基于动态原型学习的小样本视频目标分割方法,包括:获取待分割的视频目标;利用基于动态原型学习的小样本视频目标分割模型处理待分割的视频目标,获得视频目标分割结果。本发明提供的小样本视频目标分割方法,使用最优传输方法自适应学习动态原型,有效减少了噪声注意力,同时采用引导的方式对多层级特征图进行匹配,大幅减少了计算量;该方法可以充分提取少量支撑集样本中的目标信息,显著提高在质询集视频上的分割性能。本发明同时还公开了用于执行基于动态原型学习的小样本视频目标分割方法的电子设备、存储介质以及计算机程序产品。

    对抗样本生成方法、模型训练方法、处理方法及电子设备

    公开(公告)号:CN114612688A

    公开(公告)日:2022-06-10

    申请号:CN202210525739.9

    申请日:2022-05-16

    Abstract: 本发明提供一种对抗样本生成方法,包括:基于空间注意力机制,对与当前轮迭代对应的图像特征数据进行第一处理,得到与当前轮迭代对应的图像的第一图像特征向量;对与当前轮迭代对应的图像的图像特征数据进行第二处理,得到与当前轮迭代对应的图像的第二图像特征向量;对由分散度函数和特征通道权重函数构成的函数组进行求导,基于求导后的函数组,根据与当前轮迭代对应的图像的第二图像特征向量和与当前轮迭代对应的图像的第一图像特征向量,得到与当前轮迭代对应的图像的梯度值,根据与当前轮迭代对应的图像的梯度值和与当前轮迭代对应的图像,得到与下一轮迭代对应的图像;将满足预定迭代条件的图像确定为对抗样本。本发明还提供一种电子设备。

    用于图像分类的基于类别自适应模型的无监督域适应方法

    公开(公告)号:CN113011456A

    公开(公告)日:2021-06-22

    申请号:CN202110171322.2

    申请日:2021-02-05

    Abstract: 本发明提供了一种用于图像分类的基于类别自适应模型的无监督域适应方法,包括以下步骤:通过自注意模块和交叉注意模块建立领域可转移编码器,所述领域可转移编码器对源域和目标域的输入图像之间的关系进行建模,实现域内对齐和域间对齐;建立类别自适应解码器,所述类别自适应解码器通过类原型学习和对齐来减少域差异;训练时,利用所述源域的标签信息对源域图片特征的分类预测进行约束;测试时,将直接对所述目标域的图片特征进行分类预测。本发明还提供了一种用于图像分类的基于类别自适应模型的无监督域适应装置。

    一种基于关系建模的弱监督视频动作定位模型的训练方法

    公开(公告)号:CN112883868A

    公开(公告)日:2021-06-01

    申请号:CN202110186978.1

    申请日:2021-02-10

    Abstract: 本发明公开了一种基于关系建模的弱监督视频动作定位模型的训练方法,包括:构建初始动作定位模型,其中,初始动作定位模型包括:特征提取模块、视频内关系更新模块、跨视频关系更新模块、分类与定位模块;对样本视频进行特征提取输出初始视频特征;对初始视频特征进行处理得到视频内关系特征;对视频内关系特征进行处理得到背景与前景分离的跨视频特征;根据内关系特征和跨视频特征对初始动作定位模型进行训练,并通过训练后的动作定位模型对视频进行动作定位。

    基于一致性图建模的语义对应方法

    公开(公告)号:CN112836746A

    公开(公告)日:2021-05-25

    申请号:CN202110145841.1

    申请日:2021-02-02

    Abstract: 本发明公开了一种基于一致性图建模的语义对应方法,包括步骤:建立源图像与目标图像之间的特征关系,采用图卷积网络对源图像的特征和目标图像的特征进行跨模态更新;对跨模态更新后的源图像特征建立自身特征之间的第一关联关系,对跨模态更新后的目标图像特征建立自身特征之间的第二关联关系,采用图卷积网络对建立第一关联关系后的源图像特征和建立第二关联关系后目标图像特征进行模态内更新;通过一致性损失对模态内更新后的源图像特征和模态内更新后的目标图像特征建立具有循环一致性的特征对应关系,得到源图像到目标图像上的语义对应结果,能够同时捕获整张图片以及图片之间的上下文信息,建立循环一致性的语义对应,适用性强,准确度高。

    基于自监督域感知网络的零样本训练及相关分类方法

    公开(公告)号:CN111222471A

    公开(公告)日:2020-06-02

    申请号:CN202010021866.6

    申请日:2020-01-09

    Abstract: 本发明公开了一种基于自监督域感知网络的零样本训练及相关分类方法,通过自监督学习的方式充分挖掘源域和目标域之间的关系,减少因目标域数据挖掘不充分而导致的域偏差;该方法通过以agent(参考代理)作为桥梁连接所有类别建立联合的嵌入空间,学习域感知的视觉特征,具备更强的知识迁移和泛化能力;该方法基于端到端的神经网络,速度快,精度高,达到了目前最好的零样本识别结果。

    机械臂智能控制方法、装置及电子设备

    公开(公告)号:CN118990525B

    公开(公告)日:2025-02-14

    申请号:CN202411499182.1

    申请日:2024-10-25

    Abstract: 本发明提供了一种机械臂智能控制方法、装置及电子设备,应用于人工智能领域及计算机视觉领域。该方法包括:获取环境观测图像和环境深度图像;将目标语言令牌序列输入至大语言模型,得到目标物体描述文本和目标任务描述文本;将目标物体描述文本和环境观测图像输入至开放世界环境感知模型,得到目标物体的第一掩码图像;根据第一掩码图像和环境深度图像,得到目标物体的点云图像;将目标物体描述文本、目标任务描述文本和点云图像输入至大语言模型,得到机械臂的位姿估计信息;根据位姿估计信息,控制机械臂对目标物体执行与目标任务描述文本对应的相应操作。

Patent Agency Ranking