-
公开(公告)号:CN118694981A
公开(公告)日:2024-09-24
申请号:CN202411166026.3
申请日:2024-08-23
申请人: 宁波康达凯能医疗科技有限公司
IPC分类号: H04N19/895 , H04N19/136
摘要: 本发明公开了一种基于稳定扩散模型的帧间错误隐藏方法、装置及介质,涉及图像处理技术领域,包括步骤:提取视频压缩传输过程中的丢失帧以及丢失帧前后一帧的帧间图像;基于连续帧间图像对应像素之间的时空连续性特性,通过稳定性扩散模型在前后帧间图像像素值的基础上进行填补帧的获取;获取稳定性扩散模型在当前填补帧处梯度增长最快的方向,并基于该梯度方向进行填补帧的更新;在梯度变化小于预设阈值后输出填补帧完成丢失帧预测下的帧间错误隐藏。本发明基于稳定性扩散方法进行帧间错误隐藏,在保持高质量图像的同时,减少了数据传输量,从而节省了带宽并提高了传输效率,能够用于网络条件较差或需要实时传输的场景。
-
公开(公告)号:CN118509592A
公开(公告)日:2024-08-16
申请号:CN202410963993.6
申请日:2024-07-18
申请人: 宁波康达凯能医疗科技有限公司
IPC分类号: H04N19/124 , G06N3/0464 , G06T7/246 , G06V10/26 , G06V10/82 , H04N19/503 , H04N19/167 , H04N19/189
摘要: 本发明公开了一种贝叶斯框架下基于语义分割的帧间编码方法、装置及介质,涉及图像处理技术领域,包括步骤:通过空间注意力机制对ESPNet网络进行语义分割加强,并基于加强后的ESPNet网络对当前帧间图像进行空间语义分割;基于光流算法进行目标视频特征点跟踪,并根据跟踪持续时间进行静态背景特征和动态前景特征的时间语义分割;基于空间语义分割结果和时间语义分割结果,通过贝叶斯框架对各像素点进行类别概率评估获得时空语义分割结果;根据时空语义分割结果对量化参数进行动态调控;根据调整后的量化参数对当前帧间图像进行编码。本发明通过基于时空语义特征图的量化参数动态控制,在保持相同视频质量的前提下,可以实现更高的视频压缩效率。
-
公开(公告)号:CN115834885B
公开(公告)日:2023-06-13
申请号:CN202310127892.0
申请日:2023-02-17
申请人: 宁波康达凯能医疗科技有限公司
IPC分类号: H04N19/114 , H04N19/119 , H04N19/147 , H04N19/96 , G06F18/214 , G06F18/241 , G06F18/2431
摘要: 本发明公开了一种基于稀疏表示的帧间图像编码方法与系统,涉及图像处理技术领域,包括步骤:提取目标图像组中的帧内编码帧,并以帧内编码帧各编码深度下编码块的特征向量信息为训练样本分别构建训练样本矩阵和测试样本矩阵;以线性表达式的形式将各编码划分模式分类的测试样本表达为相应编码划分模式分类下训练样本的线性组合;获取稀疏全局最优解;根据稀疏全局最优解进行残差表达,并对目标图像组中的帧间图像进行编码划分模式判定;根据编码划分模式判定结果对相应帧间图像进行编码。本发明通过将编码划分转换为稀疏表示下的多分类问题,在降低了计算复杂度的同时,使得运用有本编码方法的编码器,能够以更高的效率实现帧间图像的编码。
-
公开(公告)号:CN115695803A
公开(公告)日:2023-02-03
申请号:CN202310000697.1
申请日:2023-01-03
申请人: 宁波康达凯能医疗科技有限公司
IPC分类号: H04N19/147 , H04N19/176 , H04N19/503 , H04N19/70 , H04N19/96 , G06V20/40 , G06V10/764 , G06V10/82 , G06N3/04
摘要: 本发明公开了一种基于极限学习机的帧间图像编码方法,涉及图像处理技术领域,包括步骤:提取目标视频序列中当前图像组中的帧内编码帧;提取帧内编码帧各编码深度下各编码单元与编码单元划分相关的特征向量集以及相应的划分结果作为训练集;通过训练集对初始化后的ELM分类器进行对偶优化问题下的训练;获取当前图像组中目标帧间图像当前编码深度下编码划分后目标编码单元的特征向量;通过训练后的ELM分类器依据特征向量进行划分模式判断。本发明利用极限学习机对特征关系进行研究,由于无需通过计算不同编码划分模式下的率失真代价进行编码划分判断,大大降低编码计算复杂度,提高了编码效率。
-
公开(公告)号:CN118233638A
公开(公告)日:2024-06-21
申请号:CN202410654063.2
申请日:2024-05-24
申请人: 宁波康达凯能医疗科技有限公司
IPC分类号: H04N19/136 , H04N19/147 , H04N19/154
摘要: 本发明公开了一种面向机器视觉的帧间图像编码率失真优化方法与系统,涉及图像处理技术领域,包括步骤:提取当前视频帧原始图像以及相对应重建图像在各尺度下的特征图;根据原始图像与重建图像的特征图获取基于特征相似度的失真度量;根据原始图像与重建图像的点坐标像素值获取基于平方误差的失真度量;通过混合分别基于特征相似度、基于平方误差的失真度量,进行混合失真度量控制下的率失真优化。本发明通过将视频帧映射到特征空间并利用残差深度神经网络提取多尺度特征,能够更好地符合机器视觉系统对视频内容特征的敏感性,这不仅提高了编码效率,还确保了编码后的视频内容在机器处理时的关键特征得以保留,从而提升算法的性能和任务完成度。
-
公开(公告)号:CN115695803B
公开(公告)日:2023-05-12
申请号:CN202310000697.1
申请日:2023-01-03
申请人: 宁波康达凯能医疗科技有限公司
IPC分类号: H04N19/147 , H04N19/176 , H04N19/503 , H04N19/70 , H04N19/96 , G06V20/40 , G06V10/764 , G06V10/82 , G06N3/04
摘要: 本发明公开了一种基于极限学习机的帧间图像编码方法,涉及图像处理技术领域,包括步骤:提取目标视频序列中当前图像组中的帧内编码帧;提取帧内编码帧各编码深度下各编码单元与编码单元划分相关的特征向量集以及相应的划分结果作为训练集;通过训练集对初始化后的ELM分类器进行对偶优化问题下的训练;获取当前图像组中目标帧间图像当前编码深度下编码划分后目标编码单元的特征向量;通过训练后的ELM分类器依据特征向量进行划分模式判断。本发明利用极限学习机对特征关系进行研究,由于无需通过计算不同编码划分模式下的率失真代价进行编码划分判断,大大降低编码计算复杂度,提高了编码效率。
-
公开(公告)号:CN115190318B
公开(公告)日:2023-02-14
申请号:CN202211107768.X
申请日:2022-09-13
申请人: 宁波康达凯能医疗科技有限公司
IPC分类号: H04N19/96 , H04N19/107 , H04N19/136 , H04N19/137
摘要: 本发明公开了一种基于内容相关性的视频编码方法与系统,涉及图像处理技术领域,包括步骤:获取当前编码块时域和空域上由边邻编码块组成的相关性编码块集合;依次根据编码块集合中执行划分和不执行划分的数量、执行四叉树划分和不执行四叉树划分的数量、执行垂直划分的数量和执行水平划分的数量、执行二叉树划分的数量和执行三叉树划分的数量进行相关性判断;最终获得当前编码块的编码划分模式。本发明通过对时域和空域上相邻编码块编码划分类别的统计分析,从而获得当前编码块的编码方式,在提高了编码效率的同时大大降低了编码复杂度。
-
公开(公告)号:CN114584771B
公开(公告)日:2022-09-06
申请号:CN202210484181.4
申请日:2022-05-06
申请人: 宁波康达凯能医疗科技有限公司
IPC分类号: H04N19/119 , H04N19/147 , H04N19/593 , H04N19/70 , G06N20/10
摘要: 本发明公开了一种基于内容自适应的帧内图像编码单元划分方法与系统,涉及图像处理技术领域,包括步骤:获取各训练样本在率失真优化编码下的编码单元划分结果;提取训练样本中与编码单元划分相关的各样本的第一特征向量集,以及训练样本相邻编码单元中与编码单元划分相关的各样本的第二特征向量集;基于特征向量集和相应划分结果进行第一加权SVM分类器的训练;基于训练结果依次通过第一和第三加权SVM分类器进行预测样本的划分判断;根据预测样本在各编码深度下的划分结果进行帧内图像的划分。本发明通过获取帧内图像中各编码单元的划分决策,减少非必要编码深度下的划分计算,进而提高编码效率。
-
公开(公告)号:CN114666590A
公开(公告)日:2022-06-24
申请号:CN202210574853.0
申请日:2022-05-25
申请人: 宁波康达凯能医疗科技有限公司
IPC分类号: H04N19/174 , H04N19/42 , H04N19/70 , G06K9/62 , G06V20/40 , G06F9/50 , G06V10/774 , G06V10/77
摘要: 本发明公开了一种基于负载均衡的全视场视频编码方法与系统,涉及图像处理技术领域,包括步骤:基于帧内图像编码要素提取帧内图像中存在的编码特征集;通过主成分分析对各编码特征进行线性变换,并提取特征协方差矩阵最大的主要特征集;提取训练视频序列中的主要特征集并以此通过极端随机树进行负载均衡为目标的切片划分训练;通过训练好的极端随机树对目标视频的帧内图像进行切片划分并编码。本发明通过帧内图像的数据级非均匀切片分割,进而在图像编码过程中使各处理器之间的负载均衡,在整体上减少了编码时间。
-
公开(公告)号:CN114584772A
公开(公告)日:2022-06-03
申请号:CN202210489206.X
申请日:2022-05-07
申请人: 宁波康达凯能医疗科技有限公司
IPC分类号: H04N19/124 , H04N19/154 , H04N19/503 , H04N19/70
摘要: 本发明公开了一种基于视觉注意力的全视场视频编码方法与系统,涉及图像处理技术领域,包括步骤:通过多面体投影获取全视场视频流中,帧间图像在各投影面对应视场下的二维映射帧;根据预设位序排列帧间图像各视场下的二维映射帧,并获取排列后时间序列上各帧间图像二维映射帧的帧序列;获取用户实时的视觉注意力图,并基于视觉注意力图中的感知权重调整各投影面对应视场下二维映射帧的实时量化参数;基于实时量化参数,对帧序列中各个位于同一视场相邻时间序列下的二维映射帧进行相对应的空间和时间上的帧间编码。本发明通过全视场视频编码过程中视觉注意图的加入和空间相关性的补足,在提高编码质量的情况下减少编码所需的比特率。
-
-
-
-
-
-
-
-
-