-
公开(公告)号:CN110309333B
公开(公告)日:2021-09-17
申请号:CN201910450067.8
申请日:2019-05-28
Applicant: 北京工业大学
IPC: G06F16/55 , G06F16/901 , G06N3/04
Abstract: 本发明提出了一种基于余弦度量的深度哈希图像检索方法。面对互联网上庞大的图片数据,为了满足用户的需求,找到一种快速且准确的图像检索方法成为了一个亟待解决的问题。基于余弦度量可以有效减少矢量长度的多样性进而提升检索性能,同时在损失函数中引入类别信息,它与余弦度量约束相结合,有助于共同学习同一网络中的相似性保持,也能充分利用分类信息。采用该方案可以有效的实现大规模图像检索,并且经过实验证明,本方案的性能优于目前现有的图像检索方法,具有很重要的应用价值。
-
公开(公告)号:CN108446690B
公开(公告)日:2021-09-14
申请号:CN201810555735.9
申请日:2018-05-31
Applicant: 北京工业大学
Abstract: 一种基于多视角动态特征的人脸活体检测方法,利用运动模糊图像的成像原理提取视频的运动模式映射图,并将运动模式和噪声模式相结合,用于人脸活体检测,保证用户的隐私和财产安全,抵御恶意攻击,增强人脸认证系统的安全性。包含四个主要部分,分别是:a)视频预处理,b)人脸运动模式映射,c)噪声模式提取,d)分类。当有用户请求接入人脸认证系统时,由系统摄像头获得人脸的视频,对其进行预处理,并分别提取其人脸运动模式映射图和噪声模式,其中人脸运动模式映射图将整个视频中的运动信息映射到单张图像上。然后计算灰度共生矩阵,送入支持向量机分类器进行分类,最后输出结果为活体或者假体。
-
公开(公告)号:CN113033308A
公开(公告)日:2021-06-25
申请号:CN202110204176.9
申请日:2021-02-24
Applicant: 北京工业大学
Abstract: 一种基于颜色特征的团队体育视频比赛镜头提取方法属于视频数据处理领域。首先对视频进行预处理,以镜头为单位自动切分视频将其结构化;之后计算视频帧以及镜头视频片段的r,g,b通道算术平均值,再通过K‑means聚类并依据镜头视频片段中视频帧r,g,b通道算术平均值的极差选出基准镜头视频片段,通过对比基准镜头视频片段与每个镜头视频片段的主色差异,将团队体育视频分为比赛镜头(远镜头、中镜头)视频片段和其他镜头(特写镜头、场外镜头)视频片段。本发明利用了视频帧的主色差异,提取出占据团队体育视频绝大部分内容的远镜头和中镜头视频片段,有利于减少冗余内容对视频分析处理的不利影响,为进一步研究奠定了很好的结构化基础。
-
公开(公告)号:CN109903312B
公开(公告)日:2021-04-30
申请号:CN201910071272.3
申请日:2019-01-25
Applicant: 北京工业大学
Abstract: 一种基于视频多目标跟踪的足球球员跑动距离统计方法属于体育数据统计领域。场上运动员的跑动距离是一项重要的统计数据。随着计算机视觉技术的发展,本文提出了一种基于足球比赛视频的球员跑动距离统计方案。首先,本方法通过分析足球比赛视频可以获得视频中的多目标跟踪数据。然后汇总各个跟踪轨迹,经过轨迹平滑以及顶视图映射操作,最后计算得到球员的跑动轨迹、跑动距离,输出可视化结果。该方法是实现统计球员跑动轨迹、跑动距离的一套完整解决方案,旨在减少人工标注的成本,并通过测试验证了方法可行性,具有重要应用价值。
-
公开(公告)号:CN112712127A
公开(公告)日:2021-04-27
申请号:CN202110019810.1
申请日:2021-01-07
Applicant: 北京工业大学
Abstract: 一种结合图卷积神经网络的图像情感极性分类方法,涉及智能媒体计算和计算机视觉技术领域;首先对训练样本进行物体信息的提取,并用每张图片中的物体信息、视觉特征建立图模型;其次以图卷积网络对图模型中包含的物体交互信息提取,并与卷积神经网络的特征进行融合;然后将训练样本进行预处理后传入网络中,利用损失函数和优化器对模型的参数进行迭代更新直至达到收敛,完成训练;最后将测试数据送入网络中,得到模型对测试数据的预测结果以及分类准确率。本发明通过提取图像中物体在情感空间的交互特征使分类特征更符合物体的情感特征以及人类情感触发机理,在视觉特征的基础上增加高级语义特征,有助于提升情感分类算法在实际应用场景中的性能。
-
公开(公告)号:CN107657043B
公开(公告)日:2021-04-16
申请号:CN201710924505.0
申请日:2017-09-30
Applicant: 北京工业大学
IPC: G06F16/9536 , G06F16/951 , G06F16/535 , G06F16/583 , G06Q50/00
Abstract: 一种基于内容的混合图模型图像推荐方法涉及智能媒体计算和大数据分析技术领域。本发明利用社交策展网站的多种关系结构的数据,将各种数据关系组成一个混合图模型,充分利用网的数据,结合随机游走算法和图片的内容信息给用户推荐图片。本发明将内容信息和混合图相结合能更大的提高推荐系统的推荐能力。
-
公开(公告)号:CN112488231A
公开(公告)日:2021-03-12
申请号:CN202011443669.X
申请日:2020-12-11
Applicant: 北京工业大学
Abstract: 一种具有平衡相似性的余弦度量监督深度哈希算法属于图像检索领域。深度监督哈希具有存储成本低、计算效率高等优势。然而,相似性保持、量化误差和不平衡数据仍然是深度监督哈希中的巨大挑战。本发明提出了一种成对相似性保持的深度哈希方案,解决上述问题。本方法使用深度网络作为基础模型来提取特征,并用哈希层替换最后的分类层使其输出哈希码。本方法设计了一种损失函数,能在训练过程中有效地保持语义相似性、处理类别不均衡和难易以及量化损失的问题。本发明方法获得的哈希码,用于图像检索时,对极度不均衡数据集能有效提高检索的准确率。
-
公开(公告)号:CN111881342A
公开(公告)日:2020-11-03
申请号:CN202010578945.7
申请日:2020-06-23
Applicant: 北京工业大学
IPC: G06F16/9535 , G06F16/9536 , G06N3/04 , G06N3/08 , G06Q50/00
Abstract: 一种基于图孪生网络的推荐方法应用于个性化推荐领域。现有方法(1)缺乏知识扩展性,比如难以有效融合用户社交关系信息;(2)多层特征信息传播范式下,学到的特征会出现过平滑问题。因此本发明提出了一种基于图孪生网络的推荐方法,通过用户、物品的交互信息建模用户关系图和物品关系图,通过本发明设计的图卷积层,以两个同构有向图的形式分别挖掘用户关系信息和物品关系信息。最后,通过图交互层聚合两个通道的用户特征和物品特征,充分提取用户偏好信息和物品属性信息。本发明有效保持U-I特征特性,显著提高个性化推荐准确率,具备良好的模型可扩展性,有着广阔的应用前景。
-
公开(公告)号:CN111401174A
公开(公告)日:2020-07-10
申请号:CN202010154331.6
申请日:2020-03-07
Applicant: 北京工业大学
Abstract: 一种基于多模态信息融合的排球群体行为识别方法应用于计算机视觉群体行为识别领域。由于在体育分析,自动视频监控系统,人机交互应用,视频推荐系统等方面的广泛应用,群体行为识别任务备受关注。对于多人场景中的群体行为识别,目标之间以及目标和运动模式之间的关系建模能够提供有判别力的视觉线索。本发明旨在利用将图像目标间的关系以及运动模式作为多模态信息引入,然后利用序列模型GRU对这些信息进行有效编码和全局推理。最后,基于注意力机制,从时域角度整合了推断模块的得到的信息并获取最终结果。该方法实现了针对排球数据集中的群体行为识别,并通过测试验证了方法可行性,具有重要应用价值。
-
公开(公告)号:CN110826491A
公开(公告)日:2020-02-21
申请号:CN201911079839.8
申请日:2019-11-07
Applicant: 北京工业大学
Abstract: 一种手工特征与深度特征相结合的视频关键帧检测方法用于体育视频内容分析领域。基于深度特征的方法因为网络结构复杂,导致效率不高。广播视频还包括很多其他类型的镜头如中场休息、渐变镜头等。检测结果包含大量无关帧。针对这一问题,提出了一种手工特征与深度特征相结合的视频关键帧检测方法。首先基于颜色直方图特征进行镜头边界检测获取最后一帧。进一步基于直方图相似性提出一种类似聚类的方法得到候选关键帧。最后,基于深度神经网络对候选关键帧进行分类,得到真正的关键帧。在冰壶比赛视频和篮球比赛视频上的对比实验结果表明,相对于传统的背景差分法、光流法等,该方法能够快速、可靠地提取关键帧。
-
-
-
-
-
-
-
-
-