-
公开(公告)号:CN115439786A
公开(公告)日:2022-12-06
申请号:CN202211085097.1
申请日:2022-09-06
Applicant: 北京航空航天大学 , 国家计算机网络与信息安全管理中心
IPC: G06V20/40 , G06V20/52 , G06V10/82 , G06V10/25 , G06V10/776
Abstract: 本发明公开了一种基于重复检测优化的体育视频中多目标跟踪方法,包括如下步骤:S1,将某训练轮次的某帧图像输入到网络模型中,以获得初步的检测结果;S2,对检测结果的包围盒信息采用所述网络模型的自检测,以得到原检测损失;S3,再对检测结果的包围盒信息采用预设方法检测,以得到复检损失;S4,将复检损失和原检测损失合并为总检测损失,反向传播给所述网络模型进行权重优化,以获得新网络模型;S5,将所述图像再次输入到所述新网络模型中,得到无重复检测的检测结果,解决了现有多目标跟踪方法在体育视频中重复检测的问题,同时能够大幅减少现有多目标跟踪方法的模型在行人视频中的训练时长并保持跟踪质量,提升训练效率。
-
公开(公告)号:CN115393769A
公开(公告)日:2022-11-25
申请号:CN202211044669.1
申请日:2022-08-30
Applicant: 北京航空航天大学 , 国家计算机网络与信息安全管理中心
IPC: G06V20/40 , G06V10/774 , G06V10/82 , G06N3/08
Abstract: 本发明涉及计算机视觉的视频处理技术领域,提供了一种基于群体运动信息的体育视频中流畅回合定位方法。该方法包括:获得当前视频的运动变化指标,并将所述运动变化指标作为群体运动信息,衡量体育视频中运动员的运动剧烈程度;根据所述运动变化指标定位出视频中的流畅回合,以达到分割体育视频的目的。本发明通过将视频中运动员跟踪结果采用矩阵形式表示,获得将流畅回合和非流畅回合表示为易于区分的特征;采用的流畅回合的定位方法,获得了分割体育视频理想的定位效果。
-
公开(公告)号:CN117274301A
公开(公告)日:2023-12-22
申请号:CN202311075012.6
申请日:2023-08-24
Applicant: 北京航空航天大学 , 国家计算机网络与信息安全管理中心
IPC: G06T7/246 , G06V20/40 , G06V10/774 , G06N3/0455 , G06N3/084
Abstract: 本发明涉及一种基于目标提名置换的体育视频中多目标跟踪匹配方法,属于目标检测技术领域,解决了现有技术中多目标跟踪方法在体育视频中重复检测和目标丢失的问题。本发明多次运用匈牙利算法构造匹配损失矩阵,不断更新相邻帧的目标匹配质量,最终获取最优匹配的方案,能够降低重复检测的问题,在视频中运动员外观相似的情况下,不会将未遮挡或未重合的单个目标判定为出现遮挡或重合,不会对该单个目标输出多个包围盒。还能够减少体育视频中因运动员互相遮挡和快速移动引起的目标丢失的情况。
-
公开(公告)号:CN119539013A
公开(公告)日:2025-02-28
申请号:CN202510080721.6
申请日:2025-01-20
Applicant: 北京航空航天大学杭州创新研究院 , 北京航空航天大学
IPC: G06N3/084 , G06N3/0985 , G06N3/0455 , G06V10/82 , G06V10/25 , G06V10/764 , G06V20/70 , G06F40/30 , G06F18/25 , G06F18/22
Abstract: 本公开的实施例涉及目标检测领域,具体涉及基于小样本提示微调的多模态检测模型训练方法和装置。该方法的一实施方式包括:获取训练样本集和初始多模态检测模型;执行训练步骤:得到文本语义嵌入向量序列,对第一层文本提示向量序列与文本语义嵌入向量序列进行拼接处理,得到初始文本嵌入向量序列;得到图像块嵌入向量序列组,对第一层图像提示向量序列与图像块嵌入向量序列进行拼接处理,得到初始图像嵌入向量序列组;得到图像文本相似度矩阵组;对各个图像文本相似度矩阵进行融合处理,得到图像文本对齐分数矩阵;生成分类标注图像;确定多模态检测损失值;确定多模态检测模型。该实施方式可以降低多模态检测模型的复杂度,减少计算资源的占用。
-
公开(公告)号:CN119495127A
公开(公告)日:2025-02-21
申请号:CN202510075914.2
申请日:2025-01-17
Applicant: 北京航空航天大学杭州创新研究院 , 北京航空航天大学
IPC: G06V40/20 , G06V20/40 , G06V10/82 , G06N3/044 , G06N3/0464
Abstract: 本公开的实施例涉及视频检测技术领域,具体涉及基于多模态大模型微调的视频行为识别方法、装置和设备。本公开方法的一具体实施方式包括:获取视频行为识别数据集和初始视频行为识别模型;对于每个视频行为识别数据,执行以下步骤:确定视频行为识别数据包括的视频帧序列对应的关键帧图像;将关键帧图像存储至预设图像存储位置;基于标签文本模板、关键帧图像、图像存储路径和视频行为识别数据包括的行为标签,生成训练样本,其中,训练样本包括样本图像和样本标签数据;对初始视频行为识别模型进行训练,以及确定为视频行为识别模型;将目标视频数据输入视频行为识别模型,得到视频行为文本信息。该实施方式可以提高视频行为识别模型的训练时长。
-
公开(公告)号:CN119887936A
公开(公告)日:2025-04-25
申请号:CN202411950406.6
申请日:2024-12-27
Applicant: 北京航空航天大学杭州创新研究院 , 北京航空航天大学
Abstract: 本公开的实施例公开了基于激光振镜的结构光系统的建模和标定方法和装置。该方法的一具体实施方式包括:获取第一棋盘格图像集;根据第一棋盘格图像集,确定第一初始内参信息、投影装置对应的第二初始内参信息、拍摄装置和投影装置之间的初始旋转信息和初始平移信息;获取第二棋盘格图像集;获取能量生成函数;根据第二棋盘格图像集,确定在能量生成函数对应函数值最小化的条件下的最优解,以生成第一内参信息、第二内参信息、初始旋转信息、平移信息和线性映射矩阵,作为基于激光振镜下的结构光系统的标定参数信息。该实施方式基于激光振镜,可以实现针对结构光系统进行高精准度地标定,以后续准确地确定目标物品的三维物品模型信息。
-
公开(公告)号:CN119495127B
公开(公告)日:2025-04-22
申请号:CN202510075914.2
申请日:2025-01-17
Applicant: 北京航空航天大学杭州创新研究院 , 北京航空航天大学
IPC: G06V40/20 , G06V20/40 , G06V10/82 , G06N3/044 , G06N3/0464
Abstract: 本公开的实施例涉及视频检测技术领域,具体涉及基于多模态大模型微调的视频行为识别方法、装置和设备。本公开方法的一具体实施方式包括:获取视频行为识别数据集和初始视频行为识别模型;对于每个视频行为识别数据,执行以下步骤:确定视频行为识别数据包括的视频帧序列对应的关键帧图像;将关键帧图像存储至预设图像存储位置;基于标签文本模板、关键帧图像、图像存储路径和视频行为识别数据包括的行为标签,生成训练样本,其中,训练样本包括样本图像和样本标签数据;对初始视频行为识别模型进行训练,以及确定为视频行为识别模型;将目标视频数据输入视频行为识别模型,得到视频行为文本信息。该实施方式可以提高视频行为识别模型的训练时长。
-
公开(公告)号:CN119313990B
公开(公告)日:2025-04-08
申请号:CN202411864901.5
申请日:2024-12-18
Applicant: 北京航空航天大学杭州创新研究院 , 北京航空航天大学
IPC: G06V10/764 , G06V10/77 , G06V10/40 , G06V10/26 , G06V10/82 , G06T7/00 , G06N3/0499 , G06N3/08
Abstract: 本公开的实施例涉及图像处理技术领域,具体涉及病理切片图像分析系统、方法和计算机可读介质。该系统的实施方式包括:病理切片扫描装置、病理图像分析服务器和病理信息存储服务器,其中:病理切片扫描装置,用于得到数字病理全玻片图像;病理图像分析服务器,用于对数字病理全玻片图像进行块划分,得到初始子切片图像序列;对各个初始子切片图像进行染色标准化处理,得到子切片图像序列;对各个子切片图像进行分类处理,得到合格子切片图像序列;将合格子切片图像输入图像特征提取模型,得到子切片图像特征向量序列;生成病理切片分类置信度结果;确定病理切片分类信息,以及发送至病理信息存储服务器。该实施方式可以提高病理切片的分类准确性。
-
公开(公告)号:CN119515495A
公开(公告)日:2025-02-25
申请号:CN202411550261.0
申请日:2024-11-01
Applicant: 北京航空航天大学杭州创新研究院 , 北京航空航天大学
IPC: G06Q30/0601 , G06F16/9535 , G06F18/214 , G06N3/042
Abstract: 本公开的实施例公开了任务导向的多模态物品推荐方法、装置、电子设备和介质。该方法的一具体实施方式包括:获取物品模态数据集和用户物品间交互数据集;生成初始物品模态关系图矩阵集、用户物品交互矩阵和物品间二阶交互关系矩阵;生成训练样本集,以及执行以下训练步骤:将初始交互嵌入表示集合、各个物品模态嵌入表示集合、初始物品模态关系图矩阵集和用户物品交互矩阵输入初始物品推荐模型;确定每个训练样本对应的交互预测值;生成物品推荐损失值;响应于物品推荐损失值小于预设损失阈值,将初始物品推荐模型确定为物品推荐模型;利用物品推荐模型,生成物品推荐信息。该实施方式可以提高物品推荐模型的性能,将用户感兴趣的物品推荐给用户。
-
公开(公告)号:CN119313990A
公开(公告)日:2025-01-14
申请号:CN202411864901.5
申请日:2024-12-18
Applicant: 北京航空航天大学杭州创新研究院 , 北京航空航天大学
IPC: G06V10/764 , G06V10/77 , G06V10/40 , G06V10/26 , G06V10/82 , G06T7/00 , G06N3/0499 , G06N3/08
Abstract: 本公开的实施例涉及图像处理技术领域,具体涉及病理切片图像分析系统、方法和计算机可读介质。该系统的实施方式包括:病理切片扫描装置、病理图像分析服务器和病理信息存储服务器,其中:病理切片扫描装置,用于得到数字病理全玻片图像;病理图像分析服务器,用于对数字病理全玻片图像进行块划分,得到初始子切片图像序列;对各个初始子切片图像进行染色标准化处理,得到子切片图像序列;对各个子切片图像进行分类处理,得到合格子切片图像序列;将合格子切片图像输入图像特征提取模型,得到子切片图像特征向量序列;生成病理切片分类置信度结果;确定病理切片分类信息,以及发送至病理信息存储服务器。该实施方式可以提高病理切片的分类准确性。
-
-
-
-
-
-
-
-
-