-
公开(公告)号:CN101600109A
公开(公告)日:2009-12-09
申请号:CN200910088916.6
申请日:2009-07-13
Applicant: 北京工业大学
Abstract: 基于纹理和运动特征的H.264降尺寸转码方法,属于计算机数字视频转码技术领域。本发明具体包括以下步骤:(1)获取输入H.264编码码流中的编码信息,包括:帧间编码模式、运动矢量和离散余弦变换系数;(2)根据图像纹理特征,利用运动边缘检测划分运动区域和背景区域;(3)对位于不同区域内的宏块,根据其运动特征采用相应的帧间模式;对位于运动区域的宏块,根据其运动差异性分别选择自适应运动矢量下采样方法或者最严重加权法进行运动矢量重建,对位于背景区域的宏块采用平均加权法进行运动矢量重建,对位于运动目标边缘和内部的宏块进行运动搜索。与其它方法相比,使用本方法可以既能够保证转码后视频质量,又有效解决了降尺寸转码实时性问题。
-
公开(公告)号:CN100433016C
公开(公告)日:2008-11-12
申请号:CN200610113046.X
申请日:2006-09-08
Applicant: 北京工业大学
Abstract: 一种基于图像突变的图像检索方法,涉及图像检索领域。目前,复杂背景下图像的自动分割方法过于简单,且容易破坏图像内部语义的相关性。本发明的首先将用户上传的样例图像的颜色数据从GRB空间转换到HSV空间,并归一化处理;然后根据像素间的相关性和信息突变特性,对图像进行初始分割,并根据分割后的像素块间的相似性,进行循环合并,将图像分割为3×3子块;分别抽取9个区域的特征向量,即HSV颜色直方图、分块主色以及中心矩;由用户从9个区域中选取感兴趣区域,与待检索图像进行的进行相似性比较,得到进行图像检索结果。本发明在图像的检索过程中兼顾检索算法的低复杂度与图像语义贴合性,检索结果与人类认知具有良好的一致性。
-
公开(公告)号:CN114882390B
公开(公告)日:2024-05-28
申请号:CN202210250171.4
申请日:2022-03-15
Applicant: 北京工业大学
IPC: G06V20/40 , G06V10/50 , H04N19/186 , H04N19/503 , H04N19/177
Abstract: VVC编码标准中基于CTU直方图的视频帧类型决策方法属于视频压缩编码领域。本发明包括以下方面:第一,基于CTU直方图度量帧间内容变化程度;第二,基于CTU直方图的视频帧类型决策。本发明充分利用了CTU直方图计算复杂度低且能很好地表征视频内容特性的优势,与现有视频编码器中基于编码开销的思想相结合,实现视频帧类型的高效决策,有效提升视频整体压缩效率。
-
公开(公告)号:CN112084843B
公开(公告)日:2024-03-12
申请号:CN202010735133.9
申请日:2020-07-28
Applicant: 北京工业大学
IPC: G06V20/10 , G06V10/764 , G06V10/762 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/0895
Abstract: 本发明公开了一种基于半监督学习的多光谱河道遥感监测方法,实现对于多光谱河道遥感图像中的河流区域的识别与河道宽度监测的任务。基于多光谱遥感图像的光谱信息,发明一种基于半监督学习的目标区域分类方法,以及基于集成学习的目标区域分类结果融合方法。该方法通过对于多光谱遥感图像进行基于对称卷积神经网络的特征提取,并基于半监督学习和集成学习实现多光谱遥感图像的区域分类识别任务。最后基于计算机视觉设计理念,实现了河道宽度的自动测量监测。
-
公开(公告)号:CN116347107A
公开(公告)日:2023-06-27
申请号:CN202310250176.1
申请日:2023-03-15
Applicant: 北京工业大学
IPC: H04N19/82 , H04N19/176 , H04N19/117 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了面向VVC视频编码标准基于可变CNN的QP自适应环路滤波方法,属于视频编码技术领域,本方法包含以下步骤:构建轻量级CTU质量三分类网络;构建三个不同复杂度的CNN滤波网络;构建滤波和分类数据集;训练轻量级CTU质量三分类网络模型和三个不同复杂度的CNN滤波网络模型;将轻量级CTU质量三分类网络与三个不同复杂度的CNN滤波网络耦合,并集成到VVC标准VTM6.0中。本发明充分利用了深度学习在图像滤波去噪方面的优势,改善了视频编码器中环路滤波器的性能,有效提升视频整体质量和压缩效率。
-
公开(公告)号:CN115661034A
公开(公告)日:2023-01-31
申请号:CN202211170347.1
申请日:2022-09-22
Applicant: 北京工业大学
IPC: G06T7/00 , G06T7/10 , G06T7/62 , G06N3/0455 , G06N3/0464 , G06N3/09
Abstract: 本发明公开了基于机器视觉的公路边坡微小位移形变监测方法,包含以下步骤:构建基于公路边坡图像的轻量级裂缝分割网络模型;训练轻量级裂缝分割网络模型;将待识别的公路边坡裂缝图片输入到训练后的轻量级裂缝分割网络模型;轻量级裂缝分割网络模型对对输入图片进行自动的分割。利用分割结果来统计裂缝的面积变化,实现对边坡微小形变位移的监测。本发明充分利用了卷积神经网络在图像分割领域内展现的优势,创新性地将逐通道卷积与空洞卷积的思想相结合,构建了包含多个阶段性模块的编码‑解码网络,在保证公路边坡裂缝分割性能的前提下,通过减少参数量,有效降低了标准卷积运算的复杂度及网络深度,为软硬件集成与实际应用提供了可能性。
-
公开(公告)号:CN112985692B
公开(公告)日:2022-11-29
申请号:CN202110182152.8
申请日:2021-02-09
Applicant: 北京工业大学
Abstract: 本发明公开了一种融合多项式与学习模型的气压传感器误差标校方法,计算测量气压值和标准气压值之间的误差,分析输入的标准气压值与误差之间散点图的分布状态,采用最小二乘法拟合其多项式,获取设计温度标校点对应的参数,然后将该多项式的参数进行分解并通过RBF神经网络分别预测具体温度点对应的多项式相关参数。最后根据某一特定温度下误差的函数解析式可获得气压测量值标校后的数值。相比于直接使用各轻量级神经网络拟合气压值与温度之间关系的方法,通过将气压传感器的数据误差进行先分解再拟合的方法具有更高的标校精度,减少53.33%的测量误差,是一种精度高、计算轻量、实用性强的气压传感器标校新方法。
-
公开(公告)号:CN114612306A
公开(公告)日:2022-06-10
申请号:CN202210250155.5
申请日:2022-03-15
Applicant: 北京工业大学
IPC: G06T3/40
Abstract: 本发明公开设计了一种面向裂缝检测的深度学习超分辨率方法,属于图像超分辨率技术领域。本发明包含以下步骤:构建用于超分辨率网络训练的裂缝图像数据集;构建面向裂缝的超分辨率网络;训练面向裂缝的超分辨率网络;裂缝图像的超分辨率放大。本发明充分利用了深度学习在图像超分辨率领域内展现的优势,基于裂缝图像特征,设计包含注意力机制和深度可分离卷积的轻量化残差模块并采用后置上采样结构构建了超分辨率网络,解决了裂缝低分辨率图像向高分辨率图像映射困难、不准确的问题,在低计算资源占用的情况下对裂缝图像进行超分辨率放大,保留了裂缝的纹理信息并提升视觉体验。
-
公开(公告)号:CN108737819A
公开(公告)日:2018-11-02
申请号:CN201810484726.5
申请日:2018-05-20
Applicant: 北京工业大学
IPC: H04N19/119 , H04N19/159 , H04N19/96
Abstract: 本发明公开了一种基于四叉树二叉树结构的灵活编码单元划分方法,在编码视频序列前有选择性的选取编码单元划分参数并在编码视频序列时自适应地跳过某些不必要的编码单元划分过程,属于下一代视频编码标准H.266领域。其特征在于,首先基于某一测试序列的帧内预测深度信息来提前获取这一测试序列的编码单元划分参数,然后在对测试序列进行编码前预先配置好所需的编码单元划分参数,从而避免不必要的编码单元划分参数选择过程,最后基于提前终止准则自适应地跳过某些不必要的编码单元划分,有效地降低编码复杂度。
-
公开(公告)号:CN105245890B
公开(公告)日:2018-01-19
申请号:CN201510674257.X
申请日:2015-10-16
Applicant: 北京工业大学
IPC: H04N19/136 , H04N19/139 , H04N19/18 , H04N19/64
Abstract: 本发明公开了一种基于视觉关注度优先级的高效视频编码方法,本方法围绕基于运动‑纹理特征的视觉关注优先级标注和基于视觉关注优先级的高质量编码优化两部分内容展开。首先,以编码对象的运动分级作为主导视觉关注特征、以编码对象的纹理信息作为辅助视觉关注特征,对编码单元进行关注度标注及优先级判别;然后,进行自适应编码变换系数调控,实现针对关注程度不同区域的差异性编码,在相同码率下,保证更优的主观视觉质量。
-
-
-
-
-
-
-
-
-