一种行人个体分割方法及装置

    公开(公告)号:CN106778705A

    公开(公告)日:2017-05-31

    申请号:CN201710065013.0

    申请日:2017-02-04

    Abstract: 本发明公开一种行人个体分割方法和装置,所述方法包括:利用预先训练好的粗粒度人形轮廓分割模型对待处理图像进行行人分割,得到区块化分割结果;所述区块化分割结果中包括多个标示成背景和前景的区块,在所述对待处理图像中被标示成背景的区块不包含行人主体,而被标示成前景的区块包含行人主体的部分图像;去除所述待处理图像中所述区块化行人分割结果对应部分中的背景图像,得到粗粒度分割图像;将所述粗粒度分割图像输入至预先训练好的细粒度人形轮廓分割模型;所述预先训练好的细粒度人形轮廓分割模型输出个体行人分割结果;其中,所述粗粒度人形轮廓分割模型和细粒度人形轮廓分割模型均通过全卷积神经网络训练得到。

    跨域自适应语义分割方法及系统

    公开(公告)号:CN113221903A

    公开(公告)日:2021-08-06

    申请号:CN202110511242.7

    申请日:2021-05-11

    Abstract: 本发明涉及一种跨域自适应语义分割方法及系统,所述方法包括获取不同域训练数据集;对训练数据集进行迭代训练,建立熵值预测模型:根据熵值预测模型,计算目标域数据的熵值;对各熵值进行多元高斯拟合,通过最大期望算法,得到两个峰值的高斯分布;根据所述高斯分布,确定伪标签;根据伪标签,重新训练目标域数据,构造语义分割模型;基于所述语义分割模型,对待处理数据进行语义分割。本发明通过对不同域训练数据集进行迭代训练,建立熵值预测模型,进而计算熵值,通过多元高斯拟合,最大期望算法,得到高斯分布,确定目标域数据的伪标签,排除手工阈值的干扰,以便于准确构造基于伪标签的语义分割模型,从而实现对待处理数据的自动语义分割。

    基于视听多模态的舞蹈生成方法、系统、装置

    公开(公告)号:CN111711868B

    公开(公告)日:2021-07-20

    申请号:CN202010595530.0

    申请日:2020-06-24

    Abstract: 本发明属于计算机视觉、视听任务领域,具体涉及一种基于视听多模态的舞蹈生成方法、系统、装置,旨在解决现有的舞蹈生成方法忽略了骨架信息关键点之间的连接关系,导致生成的舞蹈质量较差的问题。本系统方法包括:获取音频信息序列、2D舞蹈骨架信息,将2D舞蹈骨架信息作为第一信息;将第一信息转换为图像,并结合第一信息、音频信息序列中第t帧的音频信息,通过舞蹈生成模型生成新的2D舞蹈骨架信息,作为第二信息;判断t是否等于音频信息序列的长度,若否,令t=t+1,将第二信息作为第一信息,循环生成第二信息;否则以第一信息顺次转换的图像作为舞蹈片段输出。本发明提高了舞蹈生成的质量。

    基于类内判别器的弱监督图像语义分割方法、系统、装置

    公开(公告)号:CN111723813B

    公开(公告)日:2021-07-06

    申请号:CN202010506805.9

    申请日:2020-06-05

    Abstract: 本发明属于深度学习、计算机视觉及模式识别领域,具体涉及了一种基于类内判别器的弱监督图像语义分割方法、系统、装置,旨在解决弱监督采用的粗略标注带来的语义分割不准确的问题。本发明包括:为每个图像级的类别构建两级类内判别器,用以判断所属该图像类别的各像素点属于目标前景或是背景,并使用弱监督的数据进行训练;基于该类内判别器生成像素级的图像类别标签,生成语义分割结果并输出;还可以使用该标签进行图像语义分割模块或网络的训练,得到最终用于无标签输入图像的语义分割的模型。本发明充分挖掘隐含在特征编码中的类内图像信息,准确区分前景与背景像素,在仅依赖图像级标注的情况下,显著地提高弱监督语义分割模型的性能。

    基于类内判别器的弱监督图像语义分割方法、系统、装置

    公开(公告)号:CN111723813A

    公开(公告)日:2020-09-29

    申请号:CN202010506805.9

    申请日:2020-06-05

    Abstract: 本发明属于深度学习、计算机视觉及模式识别领域,具体涉及了一种基于类内判别器的弱监督图像语义分割方法、系统、装置,旨在解决弱监督采用的粗略标注带来的语义分割不准确的问题。本发明包括:为每个图像级的类别构建两级类内判别器,用以判断所属该图像类别的各像素点属于目标前景或是背景,并使用弱监督的数据进行训练;基于该类内判别器生成像素级的图像类别标签,生成语义分割结果并输出;还可以使用该标签进行图像语义分割模块或网络的训练,得到最终用于无标签输入图像的语义分割的模型。本发明充分挖掘隐含在特征编码中的类内图像信息,准确区分前景与背景像素,在仅依赖图像级标注的情况下,显著地提高弱监督语义分割模型的性能。

    一种跨域行为识别方法、装置、设备及可读存储介质

    公开(公告)号:CN113792751B

    公开(公告)日:2024-06-04

    申请号:CN202110860109.2

    申请日:2021-07-28

    Abstract: 本发明提供一种跨域行为识别方法、装置、设备及可读存储介质,涉及视觉识别技术领域,该方法包括以下步骤;将待预测数据输入至行为识别模型中,得到行为识别模型输出的视频动作识别结果;其中,行为识别模型通过对融合训练集和源域训练集训练得到,融合训练集为根据同类预测结果融合和比例渐进融合原则将目标域融合数据与源域训练集进行融合得到,目标域融合数据为根据预测结果和预测结果对应的置信度得分从目标域训练集选取得到,预测结果和置信度得分由将目标域训练集输入至预训练行为识别模型中得到,预训练行为识别模型通过对源域训练集进行训练得到,本发明能兼容域之间的差异,具有通用性并且兼顾了精确度的要求。

    基于数据扰动的跨域自适应语义分割方法及装置

    公开(公告)号:CN113627433B

    公开(公告)日:2024-04-09

    申请号:CN202110680850.0

    申请日:2021-06-18

    Abstract: 本发明提供的一种基于数据扰动的跨域自适应语义分割方法及装置,该方法包括,获取待处理数据以及添加数据扰动后的语义分割特征;基于所述待处理数据以及所述语义分割特征确定损失函数;基于所述损失函数通过误差反向传播算法训练模型得到跨域自适应语义分割模型,通过对目标域中大量无标签数据,本发明对这部分数据随机加入扰动,并保证经过扰动处理的图像能够保持语义的一致性,从数据扰动和跨域原型分类器两个角度解决了源域和目标域之间的领域不一致问题,并且针对在现实应用中更具实际应用价值的少量监督问题做了针对性的设计,并在基于对抗的学习框架下,取得了优秀的分割性能,将现有的标注样本的知识迁移到新数据模型中。

    一种图像压缩方法及装置
    18.
    发明授权

    公开(公告)号:CN114663536B

    公开(公告)日:2022-12-06

    申请号:CN202210118720.2

    申请日:2022-02-08

    Abstract: 本发明提供一种图像压缩方法及装置,所述方法包括:获取待压缩图像;基于预处理规则将所述待压缩图像划分为多个图像块,并将所有所述待压缩图像块输入到预存的目标编码器中,以获取第一隐变量;将所述第一隐变量输入到预存的熵模型中,以获取第二隐变量;将所述第二隐变量输入到预存的目标解码器中,以获取压缩后的图像块,并根据所述压缩后的图像块获取压缩后的图像;本发明所述方法在图像压缩任务中引入Transformer模块并采用对称处理架构进行图像的编码和解码,提高了图像压缩效率。

    基于类别外部记忆的视频目标检测方法、系统、装置

    公开(公告)号:CN111723719B

    公开(公告)日:2021-08-13

    申请号:CN202010536900.3

    申请日:2020-06-12

    Abstract: 本发明属于领域,具体涉及了一种基于类别外部记忆的视频目标检测方法、系统、装置,旨在解决现有技术中当辅助帧数量较小时目标检测性能下降明显的问题。本发明包括:先根据训练视频信息通过自注意机制训练视频目标检测模型,再通过训练好的视频目标检测模型和自注意机制获得待测视频增强的实例特征,最后将增强后的实例特征输入通用目标检测网络的分类分支和边界框回归分支得到目标检测结果。本发明降低了现有技术中基于特征整合的视频目标检测方法对辅助帧数目的敏感性,使在辅助帧较少或没有辅助帧的情况下也能准确地进行目标检测。

    基于数据分布扩充的跨域自适应语义分割方法及系统

    公开(公告)号:CN113221902A

    公开(公告)日:2021-08-06

    申请号:CN202110511220.0

    申请日:2021-05-11

    Abstract: 本发明涉及一种基于数据分布扩充的跨域自适应语义分割方法及系统,所述跨域自适应语义分割方法包括:获取不同域训练数据集;分别对源域图像及目标域图像进行傅里叶变换,得到对应的源频域图像及目标频域图像;对源频域图像进行高频滤波,得到高频信息;对目标频域图像进行低频率波,得到低频信息;根据高频信息及低频信息,通过傅里叶反变换,得到转换图像;基于转换图像,对源域图像及目标域图像进行数据增强,得到源域扩充图像及目标域扩充图像;确定第一语义分割损失模型、第一对抗损失函数、第二对抗损失函数、语义一致性损失函数;确定第二语义分割损失模型;基于第二语义分割损失模型,可对待处理图像进行准确的语义分割,提高分割精度。

Patent Agency Ranking