-
公开(公告)号:CN114973107A
公开(公告)日:2022-08-30
申请号:CN202210729369.0
申请日:2022-06-24
申请人: 山东省人工智能研究院 , 青岛海尔智能技术研发有限公司 , 烟台艾睿光电科技有限公司 , 苏州天瞳威视电子科技有限公司
IPC分类号: G06V20/40 , G06V40/20 , G06V10/764 , G06V10/82 , G06V10/774 , G06N3/04 , G06N3/08
摘要: 本发明提供一种基于多鉴别器协同和强弱共享机制的无监督跨域视频动作识别方法、系统、电子设备及存储介质,属于计算机视觉技术领域,通过使视频动作样本经过差异化的双域鉴别器与特征提取器形成对抗训练,可以得到更具有判别性的,域不变性的特征;在不使用目标域标签信息进行训练的情况下,达到了在多个目标域数据集上都能取得高效的动作识别性能的技术效果。
-
公开(公告)号:CN114973107B
公开(公告)日:2023-03-24
申请号:CN202210729369.0
申请日:2022-06-24
申请人: 山东省人工智能研究院 , 青岛海尔智能技术研发有限公司 , 烟台艾睿光电科技有限公司 , 苏州天瞳威视电子科技有限公司
IPC分类号: G06V20/40 , G06V40/20 , G06V10/764 , G06V10/82 , G06V10/774 , G06N3/047 , G06N3/0464 , G06N3/094 , G06N3/088
摘要: 本发明提供一种基于多鉴别器协同和强弱共享机制的无监督跨域视频动作识别方法、系统、电子设备及存储介质,属于计算机视觉技术领域,通过使视频动作样本经过差异化的双域鉴别器与特征提取器形成对抗训练,可以得到更具有判别性的,域不变性的特征;在不使用目标域标签信息进行训练的情况下,达到了在多个目标域数据集上都能取得高效的动作识别性能的技术效果。
-
公开(公告)号:CN114998799B
公开(公告)日:2023-01-13
申请号:CN202210636564.9
申请日:2022-06-07
IPC分类号: G06V20/40 , G06V40/20 , G06V20/50 , G06V10/764 , G06V10/774 , G06V10/80 , G06V10/82 , G06V10/40 , G06N3/04
摘要: 本发明公开了一种基于全局知识挖掘和前景注意力的交互视频动作检测方法,准确地实现了对视频中动作实例的定位和分类;方法的具体步骤如下:对视频进行预处理,通过I3D网络将生成的视频帧获得时空特征序列,将特征序列输入到上下文信息提取模块提取不同层次的特征序列F,通过时间信息提取模块挖掘视频的全局信息,将特征序列F和特征序列连接起来,得到粗时间边界和粗分类,根据不同层次的特征结合损失函数利用前景信息增强模块得到精细化特征;本发明基于已知数据集对视频中的动作实例进行高效定位和分类,并且方法收敛速度快。
-
公开(公告)号:CN114998799A
公开(公告)日:2022-09-02
申请号:CN202210636564.9
申请日:2022-06-07
申请人: 山东省人工智能研究院 , 青岛海尔智能技术研发有限公司 , 烟台艾睿光电科技有限公司 , 苏州天瞳威视电子科技有限公司
IPC分类号: G06V20/40 , G06V40/20 , G06V20/50 , G06V10/764 , G06V10/774 , G06V10/80 , G06V10/82 , G06V10/40 , G06N3/04
摘要: 本发明公开了一种基于全局知识挖掘和前景注意力的交互视频动作检测方法,准确地实现了对视频中动作实例的定位和分类;方法的具体步骤如下:对视频进行预处理,通过I3D网络将生成的视频帧获得时空特征序列,将特征序列输入到上下文信息提取模块提取不同层次的特征序列F,通过时间信息提取模块挖掘视频的全局信息,将特征序列F和特征序列连接起来,得到粗时间边界和粗分类,根据不同层次的特征结合损失函数利用前景信息增强模块得到精细化特征;本发明基于已知数据集对视频中的动作实例进行高效定位和分类,并且方法收敛速度快。
-
公开(公告)号:CN114998934A
公开(公告)日:2022-09-02
申请号:CN202210742934.7
申请日:2022-06-27
申请人: 山东省人工智能研究院 , 山东大学 , 苏州天瞳威视电子科技有限公司 , 青岛海尔智能技术研发有限公司
IPC分类号: G06V40/10 , G06V10/82 , G06V10/80 , G06V10/774 , G06V10/764 , G06V10/40 , G06V10/26 , G06N3/04 , G06F16/583
摘要: 本发明提供一种基于多模态智能感知和融合的换衣行人重识别和检索方法、系统、电子设备及存储介质,属于计算机视觉技术领域,通过对原始的行人图像进行像素采样,并根据人体解析图对所获取的像素进行修改获得换衣后的行人图像;然后分别对原始的行人图像和换衣后的行人图像进行2D特征提取,对点云数据进行3D特征提取;最后根据提取的特征进行行人身份识别。最终达到了高效、精准地行人换衣重识别的技术效果。
-
公开(公告)号:CN114998934B
公开(公告)日:2023-01-03
申请号:CN202210742934.7
申请日:2022-06-27
申请人: 山东省人工智能研究院 , 山东大学 , 苏州天瞳威视电子科技有限公司 , 青岛海尔智能技术研发有限公司
IPC分类号: G06V40/10 , G06V10/82 , G06V10/80 , G06V10/774 , G06V10/764 , G06V10/40 , G06V10/26 , G06N3/04 , G06F16/583
摘要: 本发明提供一种基于多模态智能感知和融合的换衣行人重识别和检索方法、系统、电子设备及存储介质,属于计算机视觉技术领域,通过对原始的行人图像进行像素采样,并根据人体解析图对所获取的像素进行修改获得换衣后的行人图像;然后分别对原始的行人图像和换衣后的行人图像进行2D特征提取,对点云数据进行3D特征提取;最后根据提取的特征进行行人身份识别。最终达到了高效、精准地行人换衣重识别的技术效果。
-
公开(公告)号:CN114821246A
公开(公告)日:2022-07-29
申请号:CN202210737757.3
申请日:2022-06-28
申请人: 山东省人工智能研究院 , 烟台艾睿光电科技有限公司 , 苏州天瞳威视电子科技有限公司 , 泰华智慧产业集团股份有限公司
IPC分类号: G06V10/774 , G06V10/82 , G06N3/04 , G06N3/08
摘要: 本发明公开了基于多层次残差网络感知和注意力机制的小目标检测方法,Baseline采用单阶段检测器YOLOv5;方法的具体步骤如下:(1)构建虚拟训练样本,扩充训练数据集的规模,提升模型整体性能;(2)使用多层残差卷积提取图像多维度特征;(3)注意力机制增强浅层特征图;(4)特征金字塔连接浅层特征图;(5)利用损失函数优化模型预测目标位置信息和类别信息以及置信度;(6)P2检测层配合Lufl与VIoU Loss预测小目标。本发明发明了选择性样本增强扩充了数据集,平衡样本之间的差异,充分利用浅层特征图,显著提高小目标检测的召回率和准确率。
-
公开(公告)号:CN114758362B
公开(公告)日:2022-10-11
申请号:CN202210670639.5
申请日:2022-06-15
申请人: 山东省人工智能研究院 , 山东大学 , 烟台艾睿光电科技有限公司 , 苏州天瞳威视电子科技有限公司
IPC分类号: G06V40/10 , G06V20/52 , G06V20/70 , G06V10/26 , G06V10/28 , G06V10/74 , G06V10/82 , G06N3/04 , G06K9/62
摘要: 本发明提供一种基于语义感知注意力和视觉屏蔽的换衣行人重识别方法、系统、电子设备及存储介质,属于计算机视觉技术领域,根据人体语义分割信息分别定位人体和服装区域。通过人体语义注意力网络获得前景增强的特征表示,以突出前景信息并为原始特征图重新赋权重。通过衣物视觉外观屏蔽网络获得原始特征和视觉屏蔽特征表示。本发明通过人体语义注意力网络,可以尽可能地减少背景信息的负面影响,并获得更多的辨别性特征。通过衣物视觉外观屏蔽网络,将换衣行人重识别模型集中在与衣服无关的视觉语义信息上为行人提取更稳健的特征表示。本发明具备科学性、系统性和鲁棒性的技术效果。
-
公开(公告)号:CN114758362A
公开(公告)日:2022-07-15
申请号:CN202210670639.5
申请日:2022-06-15
申请人: 山东省人工智能研究院 , 山东大学 , 烟台艾睿光电科技有限公司 , 苏州天瞳威视电子科技有限公司
IPC分类号: G06V40/10 , G06V20/52 , G06V20/70 , G06V10/26 , G06V10/28 , G06V10/74 , G06V10/82 , G06N3/04 , G06K9/62
摘要: 本发明提供一种基于语义感知注意力和视觉屏蔽的换衣行人重识别方法、系统、电子设备及存储介质,属于计算机视觉技术领域,根据人体语义分割信息分别定位人体和服装区域。通过人体语义注意力网络获得前景增强的特征表示,以突出前景信息并为原始特征图重新赋权重。通过衣物视觉外观屏蔽网络获得原始特征和视觉屏蔽特征表示。本发明通过人体语义注意力网络,可以尽可能地减少背景信息的负面影响,并获得更多的辨别性特征。通过衣物视觉外观屏蔽网络,将换衣行人重识别模型集中在与衣服无关的视觉语义信息上为行人提取更稳健的特征表示。本发明具备科学性、系统性和鲁棒性的技术效果。
-
公开(公告)号:CN114821246B
公开(公告)日:2022-10-14
申请号:CN202210737757.3
申请日:2022-06-28
申请人: 山东省人工智能研究院 , 烟台艾睿光电科技有限公司 , 苏州天瞳威视电子科技有限公司 , 泰华智慧产业集团股份有限公司
IPC分类号: G06V10/774 , G06V10/82 , G06N3/04 , G06N3/08
摘要: 本发明公开了基于多层次残差网络感知和注意力机制的小目标检测方法,Baseline采用单阶段检测器YOLOv5;方法的具体步骤如下:(1)构建虚拟训练样本,扩充训练数据集的规模,提升模型整体性能;(2)使用多层残差卷积提取图像多维度特征;(3)注意力机制增强浅层特征图;(4)特征金字塔连接浅层特征图;(5)利用损失函数优化模型预测目标位置信息和类别信息以及置信度;(6)P2检测层配合Lufl与VIoU Loss预测小目标。本发明发明了选择性样本增强扩充了数据集,平衡样本之间的差异,充分利用浅层特征图,显著提高小目标检测的召回率和准确率。
-
-
-
-
-
-
-
-
-