基于双流膨胀3D卷积网络和全新损失函数的视频异常检测方法

    公开(公告)号:CN115731418A

    公开(公告)日:2023-03-03

    申请号:CN202211475696.4

    申请日:2022-11-23

    Abstract: 基于双流膨胀3D卷积网络和全新损失函数的视频异常检测方法,首先将每一个视频定义为一个视频包,划分出正类包和负类包,然后按照相同的帧数分割成若干视频片段,每一个片段看作是一个视频实例;接着输入到双流膨胀3D卷积网络I3D中提取视觉特征;同时通过光流提取网络得到视频实例的光流图像,再输入到双流膨胀3D卷积网络中提取光流特征;接着将图像特征和光流特征进行拼接得到该视频实例的I3D特征;最后将I3D特征输入到全连接分类网络中,并通过全新损失函数对全连接分类网络进行训练,最终得到能对异常事件进行有效检测的分类网络。本方法在训练时使用视频级的标签代替帧级别的标签,有效减少人工标注的成本,能显著提高模型对异常事件检测的精度。

    一种混合NOMA-FDMA物联网系统中的合作资源分配方法及装置

    公开(公告)号:CN115134925A

    公开(公告)日:2022-09-30

    申请号:CN202210608596.8

    申请日:2022-05-31

    Inventor: 徐鼎 陈柏龄 李群

    Abstract: 本发明公开了一种混合NOMA‑FDMA物联网系统中的合作资源分配方法及装置,所提方法包括如下步骤:步骤一:建立混合NOMA‑FDMA物联网系统中的合作资源分配的优化问题模型;步骤二:将步骤一所建立的优化问题转化为内外嵌套的两层优化问题,其中,外层优化问题优化信道分配,内层优化问题优化时间和功率分配;步骤三:针对所有混合中继与信道分配的组合,求解内层优化问题;步骤四:基于内层优化问题求解结果,通过匈牙利算法求解外层优化问题得到信道分配结果;步骤五:根据信道分配结果得到时间和功率分配。本发明的一种混合NOMA‑FDMA物联网系统中的合作资源分配方法,通过对各种资源进行优化,最大化了所有物联网设备的传输数据量,提升了系统的总体传输效率。

    视频监控中基于图像概念网络的行人不安全行为检测方法

    公开(公告)号:CN109376610A

    公开(公告)日:2019-02-22

    申请号:CN201811132864.3

    申请日:2018-09-27

    Abstract: 本发明公开了一种视频监控中基于图像概念网络的行人不安全行为检测方法,由事先获取的概念词汇表构建基于词激活力的语义概念网络,然后应用社会网络分析方法挖掘概念共现相关提取场景语义概念,进一步实现场景概念检测;另一方面,应用概念推理模型提取视觉一致语义概念特征;最后,应用场景语义概念优化视觉一致语义概念,并应用分类器完成基于图像识别的行人不安全行为检测。本发明能够实现行人不安全行为检测,同时对行人在参与交通过程中普遍存在的不安全行为有很好的预警效果。

    一种基于复杂网络分析方法的视觉问答问题解决方法

    公开(公告)号:CN109255359A

    公开(公告)日:2019-01-22

    申请号:CN201811134007.7

    申请日:2018-09-27

    Abstract: 本发明公开了一种基于复杂网络分析方法的视觉问答问题解决方法,包括语义概念网络构建、非随机深度游走、图像和文本特征融合及分类器,语义概念网络构建旨在挖掘概念的共现模式以增强语义表达,非随机深度游走实现复杂网络关系到低维特征的映射,在构建图像语义概念网络的基础上,应用深度游走算法学习语义概念网络中节点的潜在关系,并将复杂网络中的节点映射成一个低维特征向量,多项式逻辑回归融合图像和文本特征以解决视觉问答问题。本发明深入挖掘了概念共生模式和集群概念的层次结构,有效地集成了图像的视觉和语义特征,以及自然语言特征,为解决视觉问答问题提供了一种可行途径。

    一种基于对齐变分自编码器与三元组结合的零样本学习方法

    公开(公告)号:CN114022739B

    公开(公告)日:2024-11-29

    申请号:CN202111364293.8

    申请日:2021-11-17

    Abstract: 一种基于对齐变分自编码器与三元组结合的零样本学习方法,输入已知类别图像特征及其对应选取的正样本和负样本组成的三元组到图像特征变分自编码器,输入已知类别图像对应的属性特征到属性变分自编码器;通过重建损失、参数对齐损失、交叉重建损失和三元组损失四种损失函数对自编码器进行优化学习;由编码器编码后获取图像特征和属性的潜在空间特征,并在潜在空间训练一个分类器。利用训练好的分类器对测试集数据进行测试。本方法能够为未知类别生成高质量潜在空间特征,弥补了零样本学习在训练过程中缺失未知类别训练样本的问题,并且能够更加紧密地联系视觉特征和语义特征,使得模型更具鲁棒性,分类精度明显提高。

    空时多尺度交互的视频摘要生成方法及系统

    公开(公告)号:CN118506145A

    公开(公告)日:2024-08-16

    申请号:CN202410955850.0

    申请日:2024-07-17

    Inventor: 李群 湛朱喜 肖甫

    Abstract: 本发明公开了空时多尺度交互的视频摘要生成方法及系统,涉及图像处理技术领域。本发明包括:接收待处理视频构成数据集,对数据集进行改造,为数据集中每个视频添加类别,并将视频按照类别划分训练集和测试集,要求测试集中的类别不能在训练集中出现;根据划分的训练集和测试集,分别为其查询集选取支持集视频。本发明能够将传统视频摘要生成技术改造成面向少样本场景的视频摘要生成技术,模型仅需要少量的样本即可快速掌握同类视频的摘要生成所需关注的重点,对于训练中没有见过的类别可以快速泛化。并且利用双分支结构获取空时特征,并结合多尺度交互方式充分利用空时特征,为生成摘要提供多尺度的信息。

Patent Agency Ranking