一种多层级多模块协同视频感知编码优化方法及装置

    公开(公告)号:CN116193122A

    公开(公告)日:2023-05-30

    申请号:CN202310189604.4

    申请日:2023-03-02

    摘要: 本发明公开了一种多层级多模块协同视频感知编码优化方法及装置,通过原始视频进行编码失真预测、帧级编码失真预测及帧级量化参数的推导;对原始视频的图像进行帧内/帧间预测,并将得到的预测图像与原始图像进行差计算,得到残差图像,通过预测的编码失真,对残差图像进行残差滤波,滤波后的残差图像基于残差块变换后,再根据预测的帧级编码失真和帧级量化参数,进行感知量化;基于感知量化参数进行率失真优化,优化帧内/帧间预测;构建感知质量增强网络,用于优化帧内/帧间预测;基于优化的帧内/帧间预测,对原始视频的图像进行预测、差计算、残差滤波、变换、感知量化后,进行熵编码。

    一种多层级多颗粒度感知编码失真预测方法

    公开(公告)号:CN116248883A

    公开(公告)日:2023-06-09

    申请号:CN202310156672.0

    申请日:2023-02-17

    摘要: 本发明属于视频感知编码优化领域,公开了一种多层级多颗粒度感知编码失真预测方法,包括如下步骤:步骤1:视觉感知效应和感知编码失真映射分析:构建各源视频的多层级恰可感知量化参数数据集和恰可感知编码失真数据集;步骤2:多层级多颗粒度感知编码失真预测:基于视觉感知机制,采用统计分析方法定性分析各视觉感知特征与恰可感知编码失真的映射关系。本发明解决了不同感知效应对于压缩视频的感知作用并不完全一致的问题、视频编码机制和视觉感知机制的联合约束增加感知编码失真理论分析难度,传统理论建模不能推导出理想的JNCD阈值模型的问题,满足了多颗粒感知编码优化的需求。

    基于扫描线并行熵编码二值化优化的硬件流水实现方法

    公开(公告)号:CN118972589A

    公开(公告)日:2024-11-15

    申请号:CN202411026348.8

    申请日:2024-07-30

    摘要: 本发明公开了基于扫描线并行熵编码二值化优化的硬件流水实现方法,通过获取单帧图像的系数数据,基于多个通道的扫描区域,对系数数据分块,用于多通道间并行执行分块的遍历;构建扩展数组和二维数组用于分块内的系数遍历,扩展数组中,存储上一分块的参考编码系数信息及当前分块的编码系数信息,二维数组中,第一维数组存储当前分块各编码系数信息,第二维数组存储各当前分块编码系数信息对应的在前参考编码系数信息;分块遍历时,根据上一次循环结束后数组的结果,预处理当前分块每个编码系数及其对应的在前参考编码系数,第二维数组用于计算标志位;遍历多个通道的所有分块,计算当前编码系数的标志位的上下文索引增量,将结果顺序输出。

    一种端边云协同视频群智感知多目标性能评价方法

    公开(公告)号:CN118337639A

    公开(公告)日:2024-07-12

    申请号:CN202410592683.8

    申请日:2024-05-14

    IPC分类号: H04L41/14 H04L43/0894

    摘要: 本发明公开了一种端边云协同视频群智感知多目标性能评价方法,基于码率度量码流数据传输代价,基于码率和相应存储架构度量码流数据存储代价,基于硬件资源和能量资源的消耗度量复杂度代价;将存储、传输和复杂度代价基于消耗的成本进行同质化度量,得到统一量纲度量的参量;计算和存储静态硬件成本折算为每一路摄像头视频所需计算和存储硬件代价;计算和存储动态能耗成本折算为每一路摄像头视频编码分析所需电力消耗代价;传输存储代价根据宽带网络费用折算为每路视频传输所需成本,所有成本基于货币进行度量;基于失真和无失真情况下的多目标性能,构建机器视觉算法性能损失,通过性能损失与所述参量构建代价函数,以不同参量下性能的优劣为判据进行多目标性能评价。

    一站式人工智能图像处理模型构建方法及装置

    公开(公告)号:CN118334663A

    公开(公告)日:2024-07-12

    申请号:CN202410760236.9

    申请日:2024-06-13

    摘要: 本申请实施例提供一种一站式人工智能图像处理模型构建方法及装置,方法包括:创建图像标注任务,确定对应的图像处理模型的结构,并根据所述标准化标签存储的图像数据进行图像处理模型的训练,得到所述图像处理模型;根据与图像处理模型对应的模型定义规范确定目标部署硬件相应的前处理接口、推理接口以及后处理接口,通过推理接口将经过前处理接口处理后的标准化标签存储的图像数据输入至图像处理模型,并通过后处理接口处理图像处理模型的模型输出,根据模型输出确定对应的模型精度,在模型精度符合预设精度条件时将图像处理模型部署至目标部署硬件;本申请能够实现数据标注、模型训练、模型转换和模型部署等全流程的一体化集成,提高开发效率,降低开发成本,确保训练精度与部署精度的高度一致性。

    一种基于全局分布学习的真实图像超分辨率重建方法

    公开(公告)号:CN117670679A

    公开(公告)日:2024-03-08

    申请号:CN202311680992.2

    申请日:2023-12-08

    摘要: 本发明公开了一种基于全局分布学习的真实图像超分辨率重建方法。首先获取数据集,进行训练集和测试集的划分,然后对数据集中的图像进行格式转换,裁剪和数据增强操作;然后构建基于全局分布学习的真实图像超分辨率重建网络,包括全局分布学习模块、采样点计算模块和图像重建模块;通过低分辨率图像学习出图像的真实场景分布函数,再估计出采样点坐标,从而进行重新采样,构建出超分辨率图像;最后通过预处理后的数据集训练构建的真实图像超分辨率重建网络。相比现有的方法,只能重建整数倍比例因子的超分辨率图像,该发明能够重建出任意比例因子的超分辨率图像,且能获得更好的性能指标。

    一种应用于复杂交通场景的实时目标检测系统及方法

    公开(公告)号:CN117557783A

    公开(公告)日:2024-02-13

    申请号:CN202311646648.1

    申请日:2023-12-04

    摘要: 本发明属于人工智能中的智能交通目标检测领域,公开了一种应用于复杂交通场景的实时目标检测系统及方法,包括基础锚框匹配模块和双向多池化注意力模块,其特征在于:上述模块在目标检测过程中充分提取图像的各个尺度的特征,以低模型复杂度完成目标的识别分类。所述基础锚框匹配模块中,首先随机生成N个大小、尺寸都随机初始化的锚框,然后根据设置的距离生成算法计算样本中真实框与N个框之间的距离,并且实时调整N个框的大小,最后迭代1000轮,生成适合预测目标的锚框。所述距离生成算法采用宽高比、IOU,利用相关数ω1、ω2来控制IOU、宽高比对于候选锚框和真实框的影响程度,重新刻画的锚框与真实框的距离。

    一种高清监控视频智能转码的方法及装置

    公开(公告)号:CN112188212B

    公开(公告)日:2024-02-13

    申请号:CN202011082884.1

    申请日:2020-10-12

    摘要: 本发明公开了一种高清监控视频智能转码的方法及装置,方法包括:S1,解码;S2,缩放;S3,目标检测,通过卷积神经网络学得的特征,将图像分割成单元格,单元格用于预测边界框,从而检测中心落在单元格中的目标对象;S4,跟踪,对比前后两帧中预测的边界框,实现对目标对象的跟踪;S5,丢帧,采用自适应丢帧操作,根据目标对象的位移矢量大小,判断关键帧的间隔长短,丢弃关键帧之间的非关键帧;S6,编码;装置包括:用于解码的GV9531芯片和用于编码VC8000E芯片,还包括分别与GV9531芯片和VC8000E芯片连接的CSKY860芯片,CSKY860芯片决定需要编码的图像帧。