-
公开(公告)号:CN115131724A
公开(公告)日:2022-09-30
申请号:CN202210559142.6
申请日:2022-05-22
Applicant: 北京工业大学
IPC: G06V20/52 , G06V10/82 , G06V10/80 , G06V10/774 , G06V10/22 , G06T7/73 , G06T7/60 , G06T7/00 , G06T3/40
Abstract: 本发明公开了一种适用于远距离高俯角的安全帽佩戴检测方法,属于目标检测技术领域。本发明包含以下步骤:构建适用于实际施工监管场景的安全帽图像数据集;构建多尺度特征融合的安全帽佩戴检测网络。本发明针对现有方法对远距离高俯角的安全帽佩戴检测精度低的问题,根据实际场景需求构建了业界内专业的安全帽数据集,解决了深度学习的先验数据需求;利用CSP层和SPP层设计了特征提取模块,采用多尺寸多维度特征融合的思想设计了特征映射模块,选取大尺寸特征图进行特征映射,提高了远距离目标的检测精度,在实际应用场景中取得了优秀的检测结果。
-
公开(公告)号:CN111385585B
公开(公告)日:2022-05-24
申请号:CN202010192422.9
申请日:2020-03-18
Applicant: 北京工业大学
IPC: H04N19/70 , H04N19/96 , H04N19/44 , H04N13/161 , G06N20/00
Abstract: 本发明公开了一种基于机器学习的3D‑HEVC深度图编码单元快速决策方法,通过构建基于深度梯度提升(XGBoost)的深度图快速编码单元(CU)级别决策系统,用于解决3D‑HEVC中添加深度图和新的编码工具导致的编码复杂度高的问题。该方法包括两部分:XGBoost模型训练和快速CU分割决策。使用数据挖掘和机器学习,通过使用深度图的纹理信息作为特征属性矢量以及当前CU是否继续作为子类标签划分为子CU,来构建决策模型。从编码过程中提取了特征属性,并使用训练有素的模型来确定CU是否继续分区。与标准编码器相比,该方法具有更好的性能改善效果,与相关工作相比,在编码性能上有不同程度地提高。
-
公开(公告)号:CN108388884B
公开(公告)日:2022-05-17
申请号:CN201810221392.2
申请日:2018-03-17
Applicant: 北京工业大学
IPC: G06V20/58 , G06V20/40 , G06K9/62 , G06V10/56 , G06V10/50 , G06V10/774 , G06V10/82 , G06V10/764
Abstract: 本发明公开了基于Haar‑Adaboost算法和直方图对比的出租车检测方法,首先采集车窗区域的正负样本,提取正负样本的Haar特征;然后,基于Adaboost算法的级联分类器训练对正负样本进行处理,将待测图像和视频与基于Adaboost算法的级联分类器训练后的样本输入至加载级联分类器中,显示出租车检测结果,检测到的区域定位车顶灯区域,车顶灯区域颜色空间转换,最后进行直方图对比。考虑到实际环境中极易发生出租车相互遮挡的情况,因此选取出租车不易被遮挡的车窗区域为Haar特征提取区域。考虑到非现场执法过程中需要对复杂环境下的出租车实现实时检测,选取经典算法中实时性和鲁棒性好的Haar‑Adaboost算法训练出租车的车窗特定区域。通过该方法对出租车进行二次检测,减小出租车误检率。
-
公开(公告)号:CN111510728B
公开(公告)日:2022-05-06
申请号:CN202010282678.9
申请日:2020-04-12
Applicant: 北京工业大学
IPC: H04N19/593 , H04N19/14 , H04N19/119 , H04N19/124 , H04N19/91 , H04N19/154 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于深度特征表达与学习的HEVC帧内快速编码方法。首先,通过利用深度卷积神经网络强大的特征表达与学习能力,并将注意力机制、特征传递机制等思想与视频编码流程的先验信息相结合,构建CU划分表征矢量预测网络;其次,通过设计有效的损失函数及网络超参数完成该网络的训练过程;最后,使用网络输出结果代替四叉树划分算法的划分结果,完成视频编码流程。采用本发明的技术方案,与国际编码标准HEVC(HM16.5)相比,在保证视频编码质量基本不变的前提下,减少视频编码所需时间成本,缓解编码质量与编码速度之间的矛盾,提高HEVC的编码效率。
-
公开(公告)号:CN108737819B
公开(公告)日:2021-06-11
申请号:CN201810484726.5
申请日:2018-05-20
Applicant: 北京工业大学
IPC: H04N19/119 , H04N19/159 , H04N19/96
Abstract: 本发明公开了一种基于四叉树二叉树结构的灵活编码单元划分方法,在编码视频序列前有选择性的选取编码单元划分参数并在编码视频序列时自适应地跳过某些不必要的编码单元划分过程,属于下一代视频编码标准H.266领域。其特征在于,首先基于某一测试序列的帧内预测深度信息来提前获取这一测试序列的编码单元划分参数,然后在对测试序列进行编码前预先配置好所需的编码单元划分参数,从而避免不必要的编码单元划分参数选择过程,最后基于提前终止准则自适应地跳过某些不必要的编码单元划分,有效地降低编码复杂度。
-
公开(公告)号:CN107071496B
公开(公告)日:2020-01-17
申请号:CN201710336856.X
申请日:2017-05-14
Applicant: 北京工业大学
IPC: H04N19/96 , H04N19/13 , H04N19/122 , H04N19/109 , H04N19/147
Abstract: 本发明公开一种H.265/HEVC帧间编码单元深度快速选择方法,首先,通过探究编码单元纹理复杂度、编码器量化参数与编码单元深度选择之间的关联关系,将顶端跳过思想应用于方法优化中,设计基于纹理复杂度和量化参数的编码单元初始划分深度预测策略,跳过非必要的大尺寸编码单元划分;其次,利用编码单元深度选择与编码码率、编码失真之间的关联性,将提前终止思想应用于方法优化中,设计基于码率和失真的编码单元终止划分深度选择策略,通过离线训练的分类器解决编码单元划分与不划分的决策问题。采用本发明的技术方案,在保证编码单元划分精度的同时,可平均节约34.56%的编码时间。
-
公开(公告)号:CN105005765A
公开(公告)日:2015-10-28
申请号:CN201510370315.X
申请日:2015-06-29
Applicant: 北京工业大学
IPC: G06K9/00
CPC classification number: G06K9/00308 , G06K9/00281
Abstract: 一种基于Gabor小波和灰度共生矩阵的人脸表情识别方法,该方法首先通过手工分割的方法提取出表情图像中的“纯脸”区域,并进行彩色图像灰度化、直方图均衡化以及尺度归一化处理;然后通过一种分块提取Gabor特征统计量的方法,大大降低了传统Gabor特征的数据冗余,并首次将反映图像纹理特征的灰度共生矩阵引入到表情识别领域,以此来弥补Gabor特征分块处理造成的像素空间相关性缺失的不足;最终生成了一组用于特征表达的低维特征向量,在保证较高表情识别率的前提下,大大提高了表情识别速率。
-
公开(公告)号:CN103618900A
公开(公告)日:2014-03-05
申请号:CN201310591430.0
申请日:2013-11-21
Applicant: 北京工业大学
IPC: H04N19/167 , H04N19/186 , H04N19/176
Abstract: 本发明公开了一种基于视觉感知特征和编码信息的视频感兴趣区域提取方法,涉及视频编码领域。本发明包括以下步骤:首先从原始视频流中提取当前编码宏块的亮度信息;然后,利用当前编码宏块的帧间预测模式类型,标识空域视觉特征显著度区域;再以前一帧编码宏块分别在水平和垂直方向上的平均运动矢量为动态双阈值,根据当前编码宏块的水平及垂直方向的运动矢量与动态双阈值的比较结果,标识时域视觉特征显著度区域;最后结合空域和时域视觉特征显著度区域的标识结果,定义视频感兴趣优先级,实现视频感兴趣的自动提取。本发明方法可为基于ROI(Region of Interest,ROI)的视频编码技术提供重要编码依据。
-
公开(公告)号:CN103188496A
公开(公告)日:2013-07-03
申请号:CN201310098216.1
申请日:2013-03-26
Applicant: 北京工业大学
Abstract: 本发明属于视频压缩编码领域,公开了一种基于运动矢量分布预测的快速运动估计视频编码方法。该方法首先从原始视频数据中提取当前宏块的亮度信息,针对整像素运动矢量分布特征搜索设计简洁的运动估计搜索模板,合理分配搜索点数。然后对运动矢量分布进行预测,根据预测结果自适应地选择在搜索模板相应区域内小范围搜索。在运动估计搜索过程中对运动矢量是否为0进行判断,作为跳过模板搜索的判据。本发明方法与视频编码标准H.264中采用的运动估计搜索算法及其它改进算法相比较,能有效地加速运动估计搜索过程,减少运动估计耗时,严格控制了码率增加,保证了较好的重构图像质量,实现了快速运动估计编码。
-
公开(公告)号:CN102186070A
公开(公告)日:2011-09-14
申请号:CN201110098369.7
申请日:2011-04-20
Applicant: 北京工业大学
Abstract: 本发明公开了一种分层结构预判的快速视频编码方法,涉及视频压缩编码领域。其从原始视频数据中提取当前编码宏块的亮度信息;定义、计算并比较当前编码宏块的时/空相关性特征,率先预判出宏块应采用帧间预测或帧内预测;若选择帧间预测,定义、计算宏块的平坦度特征,并根据该特征将当前编码宏块分为平坦宏块、纹理丰富宏块和特征不显著宏块三个类型,有针对性的预判出应采用的帧间预测模式集合,提前确定最优帧间预测模式,实现快速帧间压缩编码。本发明方法在视频质量无损失,压缩码率不增加,保持输出码流结构的前提下,大幅度降低帧间编码复杂度和编码时间,继承了原标准算法高压缩比的优越性能。
-
-
-
-
-
-
-
-
-