一种基于变分信息瓶颈的跨视角地理图像检索方法

    公开(公告)号:CN114491135A

    公开(公告)日:2022-05-13

    申请号:CN202210352920.4

    申请日:2022-04-06

    摘要: 本发明公开了一种基于变分信息瓶颈的跨视角地理图像检索方法,涉及计算机视觉中的跨视角地理图像检索技术领域,以往检索模型的分类器在训练过程中会很快收敛,导致其产生的梯度包含的信息过少而不能有效的对特征提取模块进行训练,导致检索模型容易过拟合,在测试的数据集上表现不佳;本发明使用变分信息瓶颈模块在训练过程中对分类器添加高斯噪声,迫使特征提取模块提取具有视图不变性的和判别性的图像表示,来提升检索模型的泛化能力和鲁棒性,并使用变分信息瓶颈模块压缩后的特征作为检索特征;从而达到提高检索结果准确性的目的。

    一种人员转椅检测方法及其系统

    公开(公告)号:CN114241607A

    公开(公告)日:2022-03-25

    申请号:CN202210146580.X

    申请日:2022-02-17

    摘要: 本发明公开了一种人员转椅检测方法及其系统,包括:获取检测图像;获取预训练的神经网络模型,将所述检测图像逐帧输入所述神经网络模型生成人体检测框信息、人体关键点的坐标信息;对所述坐标信息的x轴数据进行滤波生成滤波x轴数据,并基于所述滤波x轴数据及其对应的图像帧的时间信息生成移动曲线;对所述滤波x轴数据进行归一化处理并构建标准余弦曲线;基于所述移动曲线和所述标准余弦曲线进行相似度计算并生成检测结果。

    基于空间降维的高分辨率人体姿态估计模型的轻量化方法

    公开(公告)号:CN114155560A

    公开(公告)日:2022-03-08

    申请号:CN202210116943.5

    申请日:2022-02-08

    摘要: 本发明公开了基于空间降维的高分辨率人体姿态估计模型的轻量化方法,涉及人体姿态估计领域,解决深度神经网络所需要的计算资源巨大的技术问题,本发明提出一种对1*1卷积核的等级替换方案。首先通过条纹状的上下文建模对输入的二维空间特征压缩后得到单维的空间特征,再分别对两个单维的空间特征进行编码学习到条纹状的注意力图,最终用学习到的两个单维空间的注意力图还原成一个双维空间的注意力图,并且用此注意力图帮助模型聚焦在关键点附近的区域;由于在自顶向下的姿态估计方法中两个一维的空间特征可以还原出一个二维的空间特征的特性,这种方法能够在保持高精度的同时将网络的计算复杂度从二次方级降低到一次方级。

    动作片段检测方法、模型训练方法及装置

    公开(公告)号:CN113033500B

    公开(公告)日:2021-12-03

    申请号:CN202110488341.8

    申请日:2021-05-06

    IPC分类号: G06K9/00 G06K9/62 G06N3/08

    摘要: 本申请实施例涉及计算机视觉技术领域,提供一种动作片段检测方法、模型训练方法及装置,针对待检测视频,枚举待检测视频中所有的候选视频段,并获取待检测视频的视频特征和所有候选视频段的视频段特征图;然后,将视频特征和视频段特征图输入预先训练的动作检测模型,利用动作检测模型进行多尺度特征提取及预测,得到每个候选视频段的预测结果;最后,根据每个候选视频段的预测结果,从所有候选视频段中确定出动作片段,从而能够从长视频中自动剪辑出动作片段。

    双分支多中心的长尾分布识别的方法

    公开(公告)号:CN113255832B

    公开(公告)日:2021-10-01

    申请号:CN202110697276.X

    申请日:2021-06-23

    IPC分类号: G06K9/62 G06N3/04 G06N3/08

    摘要: 本发明属于计算机视觉领域,提出一种双分支多中心的长尾分布识别的方法,用于解决长尾分布数据集带来的问题。将图片输入默认分支和重采样分支进行数据增强后输入深度卷积神经网络得到低维特征表示;再经过全连接层得到属于每个类别概率,乘以一个表示多中心的矩阵得到特征矩阵并取最大值,得到最终属于每个类别的概率;分别计算损失;相加得到最终的损失,依据损失对网络进行反向传播并更新权重;不断地迭代;当需要进行识别任务时,将图片输入重采样分支,得到图片属于各个类别的概率。通过双分支多中心能减轻重采样带来的数据分布变化带来的影响,可进一步处理长尾分布带来的影响,带来更好的识别分类效果,并且模型拥有更好的泛化能力。

    一种基于类中心的人脸检索方法及系统

    公开(公告)号:CN109815353B

    公开(公告)日:2021-07-13

    申请号:CN201910052416.0

    申请日:2019-01-21

    IPC分类号: G06F16/53 G06N3/04

    摘要: 本发明公开了一种基于类中心的人脸检索方法,包括注册人脸库方法和人脸检索与在线更新特征库方法;本发明所提出的采用类中心/重心的方式,有效抑制了同一个人不同照片之间受拍摄影响引入的噪声,从而显著增大了类间距,降低了系统误识率,同时有效降低了同一自然人所有照片之间的类内距,显著提高了系统准确率,检索时采用类中心/重心,因此检索的算法时间复杂度固定为O(N),不受人脸库照片数量的影响,进一步提出了在线增量更新类中心/重心的方法,从而显著加强了系统适应性。

    一种基于3D深度卷积网络的人类行为识别的方法

    公开(公告)号:CN107506712B

    公开(公告)日:2021-05-18

    申请号:CN201710697809.8

    申请日:2017-08-15

    IPC分类号: G06K9/00 G06K9/62 G06N3/04

    摘要: 本发明属于计算机视觉视频动作识别领域,公开了一种基于3D深度卷积网络的人类行为识别的方法,所述方法首先将一个视频划分为一系列连续的视频片段;然后,将连续的视频片段输入到由卷积计算层和时空金字塔池化层组成的3D神经网络得到连续的视频片段特征;然后通过长短记忆模型计算全局的视频特征作为行为模式。本发明技术具有明显优势,通过改进了标准的3维卷积网络C3D,引入多级池化能够对任意分辨率和时长的视频片段进行特征提取;同时提高模型对行为变化大的鲁棒性,有利于在保持视频质量的情况下增加视频训练数据规模;通过各个运动子状态进行关联性信息嵌入提高行为信息的完整性。