-
公开(公告)号:CN106303530B
公开(公告)日:2020-09-25
申请号:CN201610917785.8
申请日:2016-10-20
Applicant: 北京工业大学
IPC: H04N19/147 , H04N19/172 , H04N19/186 , H04N19/19 , H04N19/124 , H04N19/126
Abstract: 本发明公开了一种融合视觉感知特性的码率控制方法,根据亮度和运动强度对人眼视觉感知的影响,指导LCU层的码率分配,进一步,为了提高率失真性能,结合视觉感知特性,对拉格朗乘子λ和量化参数QP进行修正。采用本发明的技术方案,与国际编码标准HEVC(HM15.0)相比,码率控制准确性基本不变,视频的主观质量得到提高,且获得了更好的率失真性能,节省比特资源,缓解视频编码的重建图像质量与编码资源占用之间的矛盾,提高了HEVC的编码性能。
-
公开(公告)号:CN110929603A
公开(公告)日:2020-03-27
申请号:CN201911090623.1
申请日:2019-11-09
Applicant: 北京工业大学
Abstract: 本发明公开了一种基于轻量级卷积神经网络的天气现象识别方法,属于图像识别技术领域。本发明包含以下步骤:构建轻量级天气识别网络;训练天气识别网络模型;获取待识别天气图片并进行标准化处理;将处理后的数据输入到训练后的天气识别网络并输出所属类别。本发明充分利用了卷积神经网络在大规模图像识别领域内展现的优势,将深度可分离卷积、注意力机制、残差连接、迁移学习等思想相结合,在不降低识别精度的情况下有效减少了模型的计算复杂度,为其在小型设备上的部署提供了可能性。
-
公开(公告)号:CN110929602A
公开(公告)日:2020-03-27
申请号:CN201911090618.0
申请日:2019-11-09
Applicant: 北京工业大学
Abstract: 本发明公开了一种基于卷积神经网络的地基云图云状识别方法,属于图像识别技术领域。本发明包含以下步骤:构建基于地基云图的轻量级云状识别网络;训练云状识别网络模型;获取待识别云图并进行预处理;将经过预处理后的待识别云图输入到训练后的云状识别网络;云状识别网络对云图进行自动识别并输出所属类别。本发明充分利用了卷积神经网络在大规模图像识别领域内展现的优势,将逐通道卷积、通道随机混合及膨胀卷积三种思想相结合,通过减少参数量,有效降低了标准卷积运算的复杂度及网络深度,提升了云状识别的准确率,为设备集成与实际应用提供了可能性。
-
公开(公告)号:CN109587503A
公开(公告)日:2019-04-05
申请号:CN201811648995.7
申请日:2018-12-30
Applicant: 北京工业大学
IPC: H04N19/593 , H04N19/11 , H04N19/147 , H04N19/597 , H04N13/161
Abstract: 本发明公开了一种基于边缘检测的3D-HEVC深度图帧内编码模式快速决策方法,本方法通过判断当前预测单元属于平坦区域还是纹理复杂区域来简化帧内模式选择过程。若满足平坦区域条件,则跳过相应帧内预测模式;否则,通过检测边缘的方向来减少粗模式选择(RMD)中角度模式计算数量,从而降低帧内编码复杂度,减少编码时间。对比实验结果证明了本算法的有效性,与标准测试平台HTM 16.0相比,本方法在保证视频编码质量基本不变的前提下,可以节省30.61%的编码时间,有效降低了视频帧内编码的复杂度。
-
公开(公告)号:CN108600759A
公开(公告)日:2018-09-28
申请号:CN201810339487.4
申请日:2018-04-16
Applicant: 北京工业大学
Abstract: 本发明公开基于非均衡四叉树的3D-HEVC快速转码方法,利用已编码高分辨率码流中编码单元划分深度信息与降尺寸视频中CTU划分深度之间的相关性以及纹理图和深度图CTU最大划分深度之间的相关性,通过减少CTU划分深度选择范围,跳过非必要划分深度率失真代价计算过程,从而加速3D-HEVC的转码过程。采用本发明的技术方案,在保证视频质量的同时,可平均节约25.88%的编码时间。
-
公开(公告)号:CN105005765B
公开(公告)日:2018-08-28
申请号:CN201510370315.X
申请日:2015-06-29
Applicant: 北京工业大学
IPC: G06K9/00
Abstract: 一种基于Gabor小波和灰度共生矩阵的人脸表情识别方法,该方法首先通过手工分割的方法提取出表情图像中的“纯脸”区域,并进行彩色图像灰度化、直方图均衡化以及尺度归一化处理;然后通过一种分块提取Gabor特征统计量的方法,大大降低了传统Gabor特征的数据冗余,并首次将反映图像纹理特征的灰度共生矩阵引入到表情识别领域,以此来弥补Gabor特征分块处理造成的像素空间相关性缺失的不足;最终生成了一组用于特征表达的低维特征向量,在保证较高表情识别率的前提下,大大提高了表情识别速率。
-
公开(公告)号:CN108388884A
公开(公告)日:2018-08-10
申请号:CN201810221392.2
申请日:2018-03-17
Applicant: 北京工业大学
Abstract: 本发明公开了基于Haar-Adaboost算法和直方图对比的出租车检测方法,首先采集车窗区域的正负样本,提取正负样本的Haar特征;然后,基于Adaboost算法的级联分类器训练对正负样本进行处理,将待测图像和视频与基于Adaboost算法的级联分类器训练后的样本输入至加载级联分类器中,显示出租车检测结果,检测到的区域定位车顶灯区域,车顶灯区域颜色空间转换,最后进行直方图对比。考虑到实际环境中极易发生出租车相互遮挡的情况,因此选取出租车不易被遮挡的车窗区域为Haar特征提取区域。考虑到非现场执法过程中需要对复杂环境下的出租车实现实时检测,选取经典算法中实时性和鲁棒性好的Haar-Adaboost算法训练出租车的车窗特定区域。通过该方法对出租车进行二次检测,减小出租车误检率。
-
公开(公告)号:CN105245890A
公开(公告)日:2016-01-13
申请号:CN201510674257.X
申请日:2015-10-16
Applicant: 北京工业大学
IPC: H04N19/136 , H04N19/139 , H04N19/18 , H04N19/64
Abstract: 本发明公开了一种基于视觉关注度优先级的高效视频编码方法,本方法围绕基于运动-纹理特征的视觉关注优先级标注和基于视觉关注优先级的高质量编码优化两部分内容展开。首先,以编码对象的运动分级作为主导视觉关注特征、以编码对象的纹理信息作为辅助视觉关注特征,对编码单元进行关注度标注及优先级判别;然后,进行自适应编码变换系数调控,实现针对关注程度不同区域的差异性编码,在相同码率下,保证更优的主观视觉质量。
-
公开(公告)号:CN102510496A
公开(公告)日:2012-06-20
申请号:CN201110312504.3
申请日:2011-10-14
Applicant: 北京工业大学
Abstract: 基于感兴趣区域的快速降尺寸转码方法,属于计算机数字视频转码技术领域。本发明步骤:(1)获取输入H.264编码码流中的编码信息,包括:帧间编码模式、运动矢量和离散余弦变换系数;将CIF格式像素的视频降尺寸为QCIF格式,即176像素×144像素;(2)根据图像纹理特征,利用运动边缘检测划分运动区域和背景区域;(3)对位于不同区域内的宏块,根据其运动特征采用相应的帧间模式;对位于运动区域的宏块,根据其运动差异性分别选择自适应运动矢量下采样方法或者最严重加权法进行运动矢量重建,对位于背景区域的宏块采用平均加权法进行运动矢量重建,对位于运动目标边缘和内部的宏块进行运动搜索。本方法既能够保证转码后视频质量,又解决了降尺寸转码实时性问题。
-
公开(公告)号:CN101600108A
公开(公告)日:2009-12-09
申请号:CN200910088397.3
申请日:2009-06-26
Applicant: 北京工业大学
Abstract: 本发明的一种多视点视频编码中的运动和视差联合估计方法,步骤如下:A.将相同视点相邻时刻图像对应块的视差矢量,运动矢量分别作为当前编码块视差矢量的初值;B.分别将初值和已编码相邻块的预测矢量作比较,据匹配误差最小化准则选取最优预测矢量作为该区域的搜索起始点;C.结合相邻图像运动矢量和视差矢量之间的几何关系,由前一次运动/视差估计得到候选矢量来进行下一次视差/运动估计,不断修正当前运动和视差矢量,直到得到当前编码块的最佳运动矢量和视差矢量。该方法只需一次搜索过程就能同时确定最佳运动矢量和视差矢量。与全搜索算法相比,本发明峰值信噪比下降不超过0.09dB,码率比特略有节省,码率变化在-14.20%~+0.60%之间,且节省90%以上的编码时间。
-
-
-
-
-
-
-
-
-