-
公开(公告)号:CN117611455A
公开(公告)日:2024-02-27
申请号:CN202311635190.X
申请日:2023-12-01
Applicant: 北京工商大学
IPC: G06T5/00 , G06V10/774 , G06V10/82 , G06N3/045 , G06N3/0464 , G06N3/0475 , G06N3/094
Abstract: 本发明属于水下图像处理技术领域,公开了一种基于生成对抗网络的水下图像增强方法及系统,包括获取水下退化图像和对应的地面真实的成对图像集,并将成对图像集分为训练集和测试集;将成对图像集中的图像修改为大小相同的尺寸,进行图像预处理;构建水下增强模型,基于上下采样的结构,在下采样的过程中对图像进行全局特征提取;将提取的特征输入到残差网络中,使得更好的学习输入数据中的特征;将全局特征再进行上采样进行图像的复原;将生成的图像送入判别器中,判断图像是否是真实的;将训练集输入到生成器中对生成对抗网络进行训练,并保存训练好的模型;利用训练好的模型对实际水下图像进行处理,得到增强后的水下图像。
-
公开(公告)号:CN116486005A
公开(公告)日:2023-07-25
申请号:CN202310405607.7
申请日:2023-04-17
Applicant: 北京工商大学
Abstract: 本申请公开了一种基于全景X线片和深度学习模型进行牙齿三维重建的技术。本技术所要解决的问题在于传统的方式无法对口腔治疗过程充分有效表达。提出了一种以深度学习模型设计为出发点、以全景X线片为输入、三维牙齿模型为输出的端到端的牙齿重建模型,牙齿三维模型可视化。该架构使用基于编码器和解码器的网络结构来提取图像特征和深度信息;将提取的特征输入基于注意力机制的分割网络获取牙齿实例分割图;将提取的图像特征和深度信息输入生成对抗网络中,获取牙齿的矢状切片;最后将实例分割图、矢状切片和得到的牙弓曲线利用变形模块得到跟精准的三维牙齿模型。
-
公开(公告)号:CN116228729A
公开(公告)日:2023-06-06
申请号:CN202310249995.4
申请日:2023-03-15
Applicant: 北京工商大学
IPC: G06T7/00 , G06V10/764 , G06V10/82 , G06V10/94 , G06N3/0464 , G06N3/098
Abstract: 本申请公开了一种基于自步学习的异构鲁棒联邦学习技术。本技术所要解决的问题在于传统的联邦学习方法无法有效解决客户端内部和异构客户端之间噪声给模型带来影响,客户端内部噪声通常是由于人类专业知识差异,导致数据集标注错误;异构客户端之间的噪声反馈,导致最终训练的公共模型泛化能力差。提出了一种以自步学习思想为出发点,减少噪声带来的负面影响,增强模型的稳健性。该架构使用基于自步学习机制,计算预测标签于真实标签之间损失,有简到难的将每个样本加入到局部模型更新训练;最后为每个客户端分配相应的权重,减少含噪客户端知识对总体模型的影响,并更多关注在具有干净数据集和高效模型的客户端,提高模型的准确度和健壮性。
-
公开(公告)号:CN118365877A
公开(公告)日:2024-07-19
申请号:CN202410448991.3
申请日:2024-04-15
Applicant: 北京工商大学
IPC: G06V10/26 , G06V10/80 , G06V10/82 , G06N3/0455 , G06N3/08
Abstract: 本发明提供一种基于特征增强和全局特征融合的RGB‑D语义分割方法,属于计算机视觉和计算机图形学领域。该方法基于编码器‑解码器的网络结构对图像进行语义分割预测,在编码器浅层网络引入特征增强模块,利用通道注意力机制将深度分支提取到的特征信息融合到RGB分支中,增强RGB信息在浅层网络中的特征表达能力,在深层网络引入基于交叉注意力机制和混合通道嵌入相互交织的全局特征融合模块,利用深层网络的复杂语义信息,实现远程上下文交换,获得丰富的全局信息,提高语义分割准确性。本发明通过在浅层网络和深层网络使用不同的基于注意力机制的融合方式,对RGB特征和深度特征进行多阶段互补利用,从而提升语义分割的准确性。
-
公开(公告)号:CN116912741A
公开(公告)日:2023-10-20
申请号:CN202310877433.4
申请日:2023-07-17
Applicant: 北京工商大学
IPC: G06V20/40 , G06V10/46 , G06V10/26 , G06Q30/0241 , G06F3/01
Abstract: 本发明公布了一种基于视频显著性的VR视频广告植入及评价方法。其中,对于输入的VR视频,首先通过分析VR视频场景语义,输出初始的广告植入后候选空间,再通过显著性检测,输出VR视频中吸引人眼关注的区域,最后将两个区域融合,计算出最终的广告植入区域。并对植入后的效果进行了基于自然度的评价。在用户观看VR视频时,植入的区域能够不干扰用户视线并且在最吸引用户关注的地方。相比于现有的广告植入方法,本发明方法有效提升了广告植入的准确率和效率,并降低了网络的复杂度。涉及虚拟现实领域,可应用于VR图像和视频。
-
公开(公告)号:CN116245885A
公开(公告)日:2023-06-09
申请号:CN202211643044.7
申请日:2022-12-20
Applicant: 北京工商大学
IPC: G06T7/10 , G06V10/26 , G06N3/0464 , G06N3/08
Abstract: 本申请公开了一种基于多分支融合的图像全景分割方法。所述方法将包括有特征提取模块、注意力机制模块、语义分割模块、实例分割模块以及辅助细化模块。将图像输入到基本的backbone网络进行特征提取。然后,使用针对不同任务的特征金字塔网络(FPN)进一步加强特征提取,分别使用注意力机制对不同特征权重进行重新分配。之后,使用更加精细的语义分割模块的结果来对实例分割模块的背景区域进行剔除。最后,将两个分割模块结果进行融合,得到最后的图像全景分割结果。
-
-
-
-
-