一种视频行为时间轴检测方法

    公开(公告)号:CN108830212B

    公开(公告)日:2022-04-22

    申请号:CN201810597905.X

    申请日:2018-06-12

    Abstract: 本发明公布了一种视频行为时间轴检测方法,基于深度学习和时间结构建模,并结合粗粒度检测与细粒度检测做视频行为时间轴检测,在已有模型SSN的基础上,使用双流模型来提取视频的时空特征;对行为的时间结构进行建模,将单个行为分为三个阶段;接着提出一种新的能够有效提取视频行为的时间边界信息的特征金字塔;最后结合粗粒度检测与细粒度检测,使得检测结果更加精确;本发明的检测精度高,超过了当前已有的所有公开方法,具有广泛的适用性,可适用于智能监控系统或者人机监护系统中对人类感兴趣视频片段的检测,便于后续的分析与处理,具有重要的应用价值。

    图像识别模型的训练方法、装置、电子设备及存储介质

    公开(公告)号:CN114612753B

    公开(公告)日:2025-04-22

    申请号:CN202210225261.8

    申请日:2022-03-09

    Abstract: 本申请提供了一种图像识别模型的训练方法、装置、电子设备及存储介质,该方法包括:获取样本图像对应的第一图像特征向量;根据所有样本图像对应的类别和第一图像特征向量,计算每个类别的平均图像特征向量;将样本图像输入到最新更新的图像识别模型中,得到样本图像对应的分数向量;根据所有类别的平均图像特征向量和样本图像对应的分数向量,确定样本图像对应的第二图像特征向量;将样本图像的图像特征向量减去与样本图像对应的第二图像特征向量,计算样本图像的第三图像特征向量;根据所有样本图像的第三图像特征向量及其类别,对最新更新的图像识别模型进行模型更新。本申请能够消除干扰识别结果的图像特征,即上下文偏移现象。

    一种面向大规模点云场景理解任务的预训练方法

    公开(公告)号:CN117274747A

    公开(公告)日:2023-12-22

    申请号:CN202311436416.3

    申请日:2023-11-01

    Inventor: 李宏 潘志一 高伟

    Abstract: 本发明提供了一种面向大规模点云场景理解任务的预训练方法,包括:S1.点与片段对比损失:通过构造点的特征和片段特征的正负例关系,实现点与片段对比损失;S2.通道对比损失:通过构造通道上特征图之间的正负例关系,实现通道对比损失;S3.预训练:通过将点与片段对比损失和通道对比损失加权求和获得总体对比损失,然后对骨干网络参数进行预训练学习;S4.下游任务相关的监督训练。本发明方法能够在降低资源占用的情况下,为网络模型的学习提供细粒度的对比监督损失,保持点级别的细粒度监督,用于提升预训练的学习效率。

    点云几何编码方法、解码方法、编码设备及解码设备

    公开(公告)号:CN116094694A

    公开(公告)日:2023-05-09

    申请号:CN202211604777.X

    申请日:2022-12-13

    Abstract: 本发明公开了一种点云几何编码方法、解码方法、编码设备及解码设备。所述点云定义在树结构中,所述树结构中每个节点包括多个子节点,所述点云几何解码方法包括步骤:根据当前子节点的相邻节点的组合占用数目确定所述当前子节点的上下文;根据所述当前子节点的上下文对点云几何码流进行熵解码,得到所述当前子节点的占用信息。本发明按照当前子节点的相邻节点的组合占用数目确定所述当前子节点的上下文,组合占用数目考虑了当前子节点的多类相邻关系的相邻节点的占用数目,并基于组合占用数目按照相邻节点的几何结构确定上下文,更好地利用相邻节点的空间分布相关性,提高点云几何压缩性能。

    一种基于几何一致性的深度估计优化模型的构建方法

    公开(公告)号:CN115841069A

    公开(公告)日:2023-03-24

    申请号:CN202211409255.4

    申请日:2022-11-11

    Inventor: 李宏 王炎 李革

    Abstract: 本发明的基于几何一致性的深度估计优化模型的构建方法,包括以下步骤:S1.构建空间几何一致性监督模型;S2.生成纠正模型;S3.基于深度估计优化模型优化深度图的生成过程。本发明的基于几何一致性的深度估计优化模型的构建方法,主要分为两个部分:首先,构建基于空间几何一致性的监督模型和在此基础上生成纠正模型;然后在监督信号构建的基础上纠正普遍使用损失存在的缺陷,两者共同作用保障了深度估计结果的可靠性以及优化提升估计深度图的整体精度。

    一种基于因果干涉注意力的图像识别方法

    公开(公告)号:CN115170876A

    公开(公告)日:2022-10-11

    申请号:CN202210766486.4

    申请日:2022-06-30

    Inventor: 李革 柳儒杨 李宏

    Abstract: 一种基于因果干涉注意力的图像识别方法,包括以下步骤:S1.数据预处理:将作为训练数据的图像处理为模型需要的大小和格式并进行增强;S2.预处理后的训练数据进入主干基准网络,得到图像的特征图;S3.将特征图在通道维度切分为四份,视为对特征图进行了因果干涉;S4.在每一份特征图中,实现类别‑空间注意力;S5.在每一份的类别‑空间注意力的基础上上,实现点乘注意力;S6.将经过两层注意力模块之后的四个特征图在通道维度上拼接在一起,得到最终特征;S6.将最终特征输入二元分类器,得到预测结果。本发明方法能去除上下文偏移对图像识别带来的干扰,从而提升图像识别的准确率和鲁棒性,解决了现有的注意力机制加重上下文偏移的问题。

    一种点云生成方法、装置、电子设备及存储介质

    公开(公告)号:CN114972695A

    公开(公告)日:2022-08-30

    申请号:CN202210555391.8

    申请日:2022-05-20

    Abstract: 本申请提供了一种点云生成方法、装置、电子设备及存储介质,方法包括:S1、获取目标种类的点云数据;S2、对于每一点云数据,使用编码器对该点云数据进行处理,得到该点云数据对应的均值向量和方差向量;S3、基于均值向量、方差向量和高斯分布向量,得到该点云数据对应的隐码向量;S4、将第一隐码矩阵输入到点云归一化流的正向过程中,得到第一矩阵;S5、将每一点云数据和第一隐码矩阵输入到可逆解码器中,进行目标流程的正向过程,得到第二矩阵;S6、基于第一隐码矩阵和第一矩阵,计算第一损失值,并基于第一高斯分布矩阵和第二矩阵,计算第二损失值。本申请能够使得训练完成后的可逆点云解码器生成的点云具有更丰富的细节。

    一种点云的压缩方法、装置、电子设备及存储介质

    公开(公告)号:CN114782564A

    公开(公告)日:2022-07-22

    申请号:CN202210700940.6

    申请日:2022-06-21

    Abstract: 本公开涉及点云数据处理技术领域,具体提供了一种点云的压缩方法、装置、电子设备及存储介质,通过将待压缩点云划分为多个子点云块;确定每个子点云块对应的几何属性信息与颜色属性信息之间的相关系数并与预设的系数阈值进行比较,若大于,则根据几何属性信息确定该子点云块对应的距离加权图,并基于距离加权图压缩子点云块;若小于,则计算该子点云块对应的纹理复杂度并与预设的复杂度阈值进行比较,若大于,则确定该子点云块对应的相似度加权图,并基于相似度加权图压缩子点云块;若小于,则确定该子点云块对应的无权图,并基于无权图压缩子点云块。在充分考虑点云的几何属性、颜色属性、纹理信息之间的相关性的同时,实现较优的压缩性能。

    一种视频行为时间轴定位及候选框提取的方法

    公开(公告)号:CN108898076B

    公开(公告)日:2022-07-01

    申请号:CN201810607040.0

    申请日:2018-06-13

    Abstract: 一种视频行为时间轴定位及候选框提取的方法,该方法是基于未裁剪视频数据的、深度强化学习的视频行为时间轴候选框提取方法,具体步骤是:首先,在视频行为时间轴定位任务上建立了马尔科夫模型,将视频行为时间轴定位任务转化为求解马尔科夫决策过程;然后,使用经典的深度强化学习算法DQN来求解马尔科夫决策过程,使得算法自动调整时间轴窗口的长度与位置;最后,使用训练出来的智能体模型和一个动作/背景二分类器,来定位视频中的人类行为,产生时间轴候选框,以供后续更精确的定位和分析。本发明在效率与效果上超越了目前大多数先进算法,可用于定位视频中的人类行为。

    一种基于边界查找的用于视频中动作时间轴定位的方法

    公开(公告)号:CN108875610B

    公开(公告)日:2022-04-05

    申请号:CN201810569922.2

    申请日:2018-06-05

    Abstract: 一种基于边界查找的用于视频中动作时间轴定位的方法,采用时间轴边界似然的组件来改进第三阶段的定位问题。该组件通过三个步骤来执行更精确的视频动作定位:给定一段由第一和第二阶段产生的类别可知的动作提议,第一步将其左右边界扩充得到一个更大的搜索间隔片段,同时将这个时间间隔均匀等分成多个单元,每个单元包含同样数目的帧数;第二步对每一个单元计算内外概率或者边界概率,分别表示该单元位于真实标注之内或之外以及是该动作发生的开始边界或结束边界的概率;第三步基于每个单元计算出的概率,利用最大似然估计来估计出最优的动作时间轴边界,从而达到定位的效果。

Patent Agency Ranking