-
公开(公告)号:CN115439786A
公开(公告)日:2022-12-06
申请号:CN202211085097.1
申请日:2022-09-06
Applicant: 北京航空航天大学 , 国家计算机网络与信息安全管理中心
IPC: G06V20/40 , G06V20/52 , G06V10/82 , G06V10/25 , G06V10/776
Abstract: 本发明公开了一种基于重复检测优化的体育视频中多目标跟踪方法,包括如下步骤:S1,将某训练轮次的某帧图像输入到网络模型中,以获得初步的检测结果;S2,对检测结果的包围盒信息采用所述网络模型的自检测,以得到原检测损失;S3,再对检测结果的包围盒信息采用预设方法检测,以得到复检损失;S4,将复检损失和原检测损失合并为总检测损失,反向传播给所述网络模型进行权重优化,以获得新网络模型;S5,将所述图像再次输入到所述新网络模型中,得到无重复检测的检测结果,解决了现有多目标跟踪方法在体育视频中重复检测的问题,同时能够大幅减少现有多目标跟踪方法的模型在行人视频中的训练时长并保持跟踪质量,提升训练效率。
-
公开(公告)号:CN115393769A
公开(公告)日:2022-11-25
申请号:CN202211044669.1
申请日:2022-08-30
Applicant: 北京航空航天大学 , 国家计算机网络与信息安全管理中心
IPC: G06V20/40 , G06V10/774 , G06V10/82 , G06N3/08
Abstract: 本发明涉及计算机视觉的视频处理技术领域,提供了一种基于群体运动信息的体育视频中流畅回合定位方法。该方法包括:获得当前视频的运动变化指标,并将所述运动变化指标作为群体运动信息,衡量体育视频中运动员的运动剧烈程度;根据所述运动变化指标定位出视频中的流畅回合,以达到分割体育视频的目的。本发明通过将视频中运动员跟踪结果采用矩阵形式表示,获得将流畅回合和非流畅回合表示为易于区分的特征;采用的流畅回合的定位方法,获得了分割体育视频理想的定位效果。
-
公开(公告)号:CN117274301A
公开(公告)日:2023-12-22
申请号:CN202311075012.6
申请日:2023-08-24
Applicant: 北京航空航天大学 , 国家计算机网络与信息安全管理中心
IPC: G06T7/246 , G06V20/40 , G06V10/774 , G06N3/0455 , G06N3/084
Abstract: 本发明涉及一种基于目标提名置换的体育视频中多目标跟踪匹配方法,属于目标检测技术领域,解决了现有技术中多目标跟踪方法在体育视频中重复检测和目标丢失的问题。本发明多次运用匈牙利算法构造匹配损失矩阵,不断更新相邻帧的目标匹配质量,最终获取最优匹配的方案,能够降低重复检测的问题,在视频中运动员外观相似的情况下,不会将未遮挡或未重合的单个目标判定为出现遮挡或重合,不会对该单个目标输出多个包围盒。还能够减少体育视频中因运动员互相遮挡和快速移动引起的目标丢失的情况。
-
公开(公告)号:CN105373601A
公开(公告)日:2016-03-02
申请号:CN201510755911.X
申请日:2015-11-09
Applicant: 国家计算机网络与信息安全管理中心
CPC classification number: G06F16/245 , G06F21/55
Abstract: 本发明提供一种基于关键字词频特征的多模式匹配方法,首先从已知的信息数据库中提取关键字并统计出现频率作为其词频信息,其次采用构造含有关键字词频信息的二叉树完成其中的模式串匹配,在字符匹配过程中若出现字符不相等,则与该不匹配字符所在节点的兄弟节点所含字符进行匹配。其利用信息来源的模式的关键字词频信息构造基于字典树的二叉树完成其中的模式串的匹配,并与AC算法进行了比较。传统的AC算法需要维护三张表,并且在模式匹配过程中会频繁访问这三张表;本发明的一种基于关键字词频特征的多模式匹配方法更多的利用了模式本身的词频信息,并不需要维护过多的信息,这就大大减少了系统的内存消耗。
-
公开(公告)号:CN105373601B
公开(公告)日:2019-05-21
申请号:CN201510755911.X
申请日:2015-11-09
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/245 , G06F21/55
Abstract: 本发明提供一种基于关键字词频特征的多模式匹配方法,首先从已知的信息数据库中提取关键字并统计出现频率作为其词频信息,其次采用构造含有关键字词频信息的二叉树完成其中的模式串匹配,在字符匹配过程中若出现字符不相等,则与该不匹配字符所在节点的兄弟节点所含字符进行匹配。其利用信息来源的模式的关键字词频信息构造基于字典树的二叉树完成其中的模式串的匹配,并与AC算法进行了比较。传统的AC算法需要维护三张表,并且在模式匹配过程中会频繁访问这三张表;本发明的一种基于关键字词频特征的多模式匹配方法更多的利用了模式本身的词频信息,并不需要维护过多的信息,这就大大减少了系统的内存消耗。
-
公开(公告)号:CN119495127A
公开(公告)日:2025-02-21
申请号:CN202510075914.2
申请日:2025-01-17
Applicant: 北京航空航天大学杭州创新研究院 , 北京航空航天大学
IPC: G06V40/20 , G06V20/40 , G06V10/82 , G06N3/044 , G06N3/0464
Abstract: 本公开的实施例涉及视频检测技术领域,具体涉及基于多模态大模型微调的视频行为识别方法、装置和设备。本公开方法的一具体实施方式包括:获取视频行为识别数据集和初始视频行为识别模型;对于每个视频行为识别数据,执行以下步骤:确定视频行为识别数据包括的视频帧序列对应的关键帧图像;将关键帧图像存储至预设图像存储位置;基于标签文本模板、关键帧图像、图像存储路径和视频行为识别数据包括的行为标签,生成训练样本,其中,训练样本包括样本图像和样本标签数据;对初始视频行为识别模型进行训练,以及确定为视频行为识别模型;将目标视频数据输入视频行为识别模型,得到视频行为文本信息。该实施方式可以提高视频行为识别模型的训练时长。
-
公开(公告)号:CN119495127B
公开(公告)日:2025-04-22
申请号:CN202510075914.2
申请日:2025-01-17
Applicant: 北京航空航天大学杭州创新研究院 , 北京航空航天大学
IPC: G06V40/20 , G06V20/40 , G06V10/82 , G06N3/044 , G06N3/0464
Abstract: 本公开的实施例涉及视频检测技术领域,具体涉及基于多模态大模型微调的视频行为识别方法、装置和设备。本公开方法的一具体实施方式包括:获取视频行为识别数据集和初始视频行为识别模型;对于每个视频行为识别数据,执行以下步骤:确定视频行为识别数据包括的视频帧序列对应的关键帧图像;将关键帧图像存储至预设图像存储位置;基于标签文本模板、关键帧图像、图像存储路径和视频行为识别数据包括的行为标签,生成训练样本,其中,训练样本包括样本图像和样本标签数据;对初始视频行为识别模型进行训练,以及确定为视频行为识别模型;将目标视频数据输入视频行为识别模型,得到视频行为文本信息。该实施方式可以提高视频行为识别模型的训练时长。
-
公开(公告)号:CN113435660A
公开(公告)日:2021-09-24
申请号:CN202110787413.9
申请日:2021-07-13
Applicant: 中国石油大学(华东) , 中国海洋大学 , 北京航空航天大学 , 中海石油深海开发有限公司 , 中海油安全技术服务有限公司 , 烟台杰瑞石油装备技术有限公司
Abstract: 本发明属于石油工程领域,具体地,涉及一种融合卡尔曼滤波和贝叶斯网络的水下采油树重预测方法。融合卡尔曼滤波和贝叶斯网络的水下采油树重预测方法,包含三个步骤:数字孪生模型建立、退化过程重预测模型建立和剩余寿命计算模型建立。融合卡尔曼滤波和贝叶斯网络的水下采油树重预测系统,包括安装于水下分配单元的水下分配单元信息采集子系统、安装于水下控制模块的水下控制模块信息采集子系统、安装于水下阀组的水下阀组信息采集子系统、安装于井口机械模块的井口机械模块信息采集子系统、安装于水下控制模块的水下环境信息采集模块和安装于水上控制站的水下采油树数字孪生子系统。
-
公开(公告)号:CN113435660B
公开(公告)日:2022-07-08
申请号:CN202110787413.9
申请日:2021-07-13
Applicant: 中国石油大学(华东) , 中国海洋大学 , 北京航空航天大学 , 中海石油深海开发有限公司 , 中海油安全技术服务有限公司 , 烟台杰瑞石油装备技术有限公司
Abstract: 本发明属于石油工程领域,具体地,涉及一种融合卡尔曼滤波和贝叶斯网络的水下采油树重预测方法。融合卡尔曼滤波和贝叶斯网络的水下采油树重预测方法,包含三个步骤:数字孪生模型建立、退化过程重预测模型建立和剩余寿命计算模型建立。融合卡尔曼滤波和贝叶斯网络的水下采油树重预测系统,包括安装于水下分配单元的水下分配单元信息采集子系统、安装于水下控制模块的水下控制模块信息采集子系统、安装于水下阀组的水下阀组信息采集子系统、安装于井口机械模块的井口机械模块信息采集子系统、安装于水下控制模块的水下环境信息采集模块和安装于水上控制站的水下采油树数字孪生子系统。
-
公开(公告)号:CN113901902A
公开(公告)日:2022-01-07
申请号:CN202111155721.6
申请日:2021-09-30
Applicant: 北京航空航天大学
Abstract: 本发明公开了一种基于层级图卷积网络的群体场景图生成方法,利用预训练卷积神经网络提取体育视频中所有个体的视觉特征和包围盒,聚类为两个队伍,根据视觉特征构造队伍关系图和群体关系图,将队伍关系图输入队伍图卷积网络提取队伍关系特征,将群体关系图输入群体图卷积网络提取群体关系特征,根据队伍关系特征和群体关系特征生成群体场景图,上述方法能有效捕捉体育视频中群体间关系,生成群体场景图进行体育视频理解。在团体对抗型体育项目中,运动员个体间关系被弱化,队伍间关系得到凸显,因此能简化场景图生成方法的应用场景,将场景图生成方法应用于体育视频捕捉群体间关系,生成群体场景图进行体育视频的理解。
-
-
-
-
-
-
-
-
-