-
公开(公告)号:CN107696499A
公开(公告)日:2018-02-16
申请号:CN201710886339.X
申请日:2017-09-27
Applicant: 北京工业大学
IPC: B29C64/379 , B29C64/393 , B33Y40/00 , B33Y50/02
Abstract: 三维模型与机器视觉相结合的3D打印产品质量检测与修复方法涉及智能化控制等领域。该方法主要是针对3D打印产品进行后期处理,提高表面精度。步骤如下:点云数据的获取:该部分通过对物体的扫描获取物体对应的点云数据;产品的质量评价:该部分首先要进行点云数据与3D打印物体对应的模型进行对齐,给出产品表面误差状况;产品位置初始化:该部分是为了得到实际打印产品在机械系统中的世界坐标的位置;将世界坐标点与模型坐标点对齐:该部分是将已经得到的误差对应到世界坐标上;路径规划实现修复:该部分依据需要修复产品表面的具体状况,选用具体的修复算法,实现修复工作。本发明适用于平面与曲面的3D打印产品的修复工作。
-
公开(公告)号:CN107610110A
公开(公告)日:2018-01-19
申请号:CN201710803358.1
申请日:2017-09-08
Applicant: 北京工业大学
Abstract: 一种全局结构与局部信息相结合的跨尺度图像质量评价方法涉及图像处理技术领域。本发明基于人眼感知是由全局到局部的注意力机制,提供一种基于全局结构特征和局部信息特征相结合的算法对不同尺度的图像进行质量评价。本发明首先在不同尺度图像间建立映射关系,基于映射关系分别从全局和局部两方面进行研究,在全局算法中引入多个影响因子,分析图像在尺寸变换过程中引起的视觉差异;在局部算法中,基于像素信息分析图像的细节损失,最后融合全局和局部特征得到图像的质量评判标准。该客观质量评价方法与主观评价方法得到的结果比较一致,而且无须消耗大量的人力、物力,具有一定的应用价值及参考意义。
-
公开(公告)号:CN107357889A
公开(公告)日:2017-11-17
申请号:CN201710560717.5
申请日:2017-07-11
Applicant: 北京工业大学
Abstract: 一种基于内容或情感相似性的跨社交平台图片推荐算法,涉及智能媒体计算和大数据分析技术领域;首先对图文分享社交平台中的用户生成文本的内容进行分析,提取其关键词信息,同时用同样的方法对图片社交平台中的图片进行内容上的分析,根据文本与图片的内容一致性进行匹配,得到基于内容的初始推荐列表;其次对文本进行情感分析,如果文本包含情感,则基于文本与图片的情感一致性进行匹配,得到基于情感匹配的初始推荐列表;然后对用户分别在两个社交网络平台上建模,得到用户偏好;最终,融合内容、情感以及用户偏好,产生最终的图片推荐列表。本发明使得用户的表达更加充分贴切,有助于极大提升社交网络上的用户体验,提升用户黏度。
-
公开(公告)号:CN106886580A
公开(公告)日:2017-06-23
申请号:CN201710059051.5
申请日:2017-01-23
Applicant: 北京工业大学
Abstract: 一种基于深度学习的图片情感极性分析方法涉及图像内容理解和大数据分析技术领域。传统方法图片情感分析方法由于模型和特征简单使得最终预测精度不理想。目前使用深度学习的方法在大规模训练集中进行训练,但是训练集的噪音过大,使得最终的性能受限。本发明采用直接从网络中获取数据的方式,从数据规模大。只有在数据准备时需要得到的一个常用词语的情感极性信息可能需要人工标注。之后在整个的图像获取和清洗工作全都可以自动完成,需要的人工成本很低。在数据获取阶段,引入了两次数据清洗过程,可以清除很大一部分图片与标签不一致的噪音。本发明将先验知识用于训练集对训练集进行过滤,使得训练集的噪音减少,并辅以改进的网络结构,使图片情感预测准确率得到提升。
-
公开(公告)号:CN113407834B
公开(公告)日:2025-02-25
申请号:CN202110674480.X
申请日:2021-06-18
Applicant: 北京工业大学
IPC: G06F16/9535 , G06F16/36 , G06N5/025 , G06F16/9536
Abstract: 本发明公开了一种基于知识图谱辅助的用户多维度兴趣抽取方法。准确的用户兴趣表达是提升推荐性能的关键点之一,现有的推荐算法大多是采用一个单一的、混合的向量表示用户兴趣,并不能从多个维度来表达用户兴趣,这种对用户兴趣统一建模的方法忽略了隐向量中的纠缠,容易得到次优的用户兴趣表达,同时也缺乏一定的可解释性。然而,由于交互数据的稀疏性问题,在历史交互数据中学习用户的多维度兴趣表达是非常有难度的,目前相关的研究较少。本发明设计了一个知识图谱辅助的用户多维度兴趣抽取网络,可以得到多维度的用户兴趣表达,同时提供一定的可解释性。我们在音乐和书籍的数据集上验证了该方法的有效性。
-
公开(公告)号:CN113033308B
公开(公告)日:2025-01-07
申请号:CN202110204176.9
申请日:2021-02-24
Applicant: 北京工业大学
IPC: G06V10/56 , G06V20/40 , G06V10/762
Abstract: 一种基于颜色特征的团队体育视频比赛镜头提取方法属于视频数据处理领域。首先对视频进行预处理,以镜头为单位自动切分视频将其结构化;之后计算视频帧以及镜头视频片段的r,g,b通道算术平均值,再通过K‑means聚类并依据镜头视频片段中视频帧r,g,b通道算术平均值的极差选出基准镜头视频片段,通过对比基准镜头视频片段与每个镜头视频片段的主色差异,将团队体育视频分为比赛镜头(远镜头、中镜头)视频片段和其他镜头(特写镜头、场外镜头)视频片段。本发明利用了视频帧的主色差异,提取出占据团队体育视频绝大部分内容的远镜头和中镜头视频片段,有利于减少冗余内容对视频分析处理的不利影响,为进一步研究奠定了很好的结构化基础。
-
公开(公告)号:CN111881342B
公开(公告)日:2024-12-10
申请号:CN202010578945.7
申请日:2020-06-23
Applicant: 北京工业大学
IPC: G06F16/9535 , G06F16/9536 , G06N3/042 , G06N3/045 , G06N3/0464 , G06N3/048 , G06N3/08 , G06Q50/00
Abstract: 一种基于图孪生网络的推荐方法应用于个性化推荐领域。现有方法(1)缺乏知识扩展性,比如难以有效融合用户社交关系信息;(2)多层特征信息传播范式下,学到的特征会出现过平滑问题。因此本发明提出了一种基于图孪生网络的推荐方法,通过用户、物品的交互信息建模用户关系图和物品关系图,通过本发明设计的图卷积层,以两个同构有向图的形式分别挖掘用户关系信息和物品关系信息。最后,通过图交互层聚合两个通道的用户特征和物品特征,充分提取用户偏好信息和物品属性信息。本发明有效保持U‑I特征特性,显著提高个性化推荐准确率,具备良好的模型可扩展性,有着广阔的应用前景。
-
公开(公告)号:CN112488231B
公开(公告)日:2024-07-02
申请号:CN202011443669.X
申请日:2020-12-11
Applicant: 北京工业大学
IPC: G06V10/74 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 一种具有平衡相似性的余弦度量监督深度哈希算法属于图像检索领域。深度监督哈希具有存储成本低、计算效率高等优势。然而,相似性保持、量化误差和不平衡数据仍然是深度监督哈希中的巨大挑战。本发明提出了一种成对相似性保持的深度哈希方案,解决上述问题。本方法使用深度网络作为基础模型来提取特征,并用哈希层替换最后的分类层使其输出哈希码。本方法设计了一种损失函数,能在训练过程中有效地保持语义相似性、处理类别不均衡和难易以及量化损失的问题。本发明方法获得的哈希码,用于图像检索时,对极度不均衡数据集能有效提高检索的准确率。
-
公开(公告)号:CN113920153B
公开(公告)日:2024-05-28
申请号:CN202111076361.0
申请日:2021-09-15
Applicant: 北京工业大学
IPC: G06T7/207 , G06T7/70 , G06T3/06 , G06T5/70 , G06N3/0455 , G06N3/084 , G06V10/764
Abstract: 基于编码‑解码网络的深度运动分离方法属于图像处理领域。从原始混合运动中估计全局运动和局部运动是有必要的。现有的全局运动估计算法无法表达复杂场景下的全部全局运动。同时,体育比赛转播视频等存在静止的记分牌等区域,对局部运动估计造成了影响。本发明提出了一种端到端的全局与局部运动估计网络,利用自动编码器将原始运动编码为代表全部全局运动的低维向量后解码为全局运动场。网络通过混合运动场中全局运动区域的运动值进行弱监督学习。进一步,Attention U‑net将粗糙局部运动中的记分牌等噪声区域的运动值去除,得到纯净的局部运动。在行为识别数据集NCAA,UCF‑101和单应性估计数据集DHE上的实验表明,该方法的全局运动和局部运动估计结果好于现有方法。
-
公开(公告)号:CN113297936B
公开(公告)日:2024-05-28
申请号:CN202110531225.X
申请日:2021-05-17
Applicant: 北京工业大学
IPC: G06V40/20 , G06V20/40 , G06V10/764 , G06V10/82 , G06N3/042 , G06N3/0464 , G06N3/0455 , G06N3/084 , G06V10/80
Abstract: 一种基于局部图卷积网络的排球群体行为识别方法,涉及智能媒体计算和计算机视觉领域;首先对训练视频样本进行时域稀疏采样,对采样出的视频帧使用卷积神经网络提取全图特征图,并利用RoI Align根据图像中的个体候选框的位置提取个体视觉特征图;其次建立个体自连接图模型和个体间连接图模型,并以图卷积网络对图模型中的个体局部特征进行交互信息的传递得到关系特征图,并将其与个体视觉特征图进行融合;将训练样本进行预处理后传入网络中,利用损失函数和优化器对模型的参数进行迭代更新直至达到收敛,完成训练;最后将测试数据送入网络中,得到模型对测试数据的预测结果以及分类准确率。本发明有助于提升群体行为识别算法的性能。
-
-
-
-
-
-
-
-
-