-
公开(公告)号:CN114513661B
公开(公告)日:2022-09-06
申请号:CN202210413096.9
申请日:2022-04-20
申请人: 宁波康达凯能医疗科技有限公司
IPC分类号: H04N19/11 , H04N19/147
摘要: 本发明公开了一种基于方向检测的帧内图像模式决策方法与系统,涉及图像处理技术领域,主要包括步骤:获取目标编码块分别与各基准方向上的方向编码块之间,编码块各对应位置处样本值的平方差之和;根据最小平方差之和所对应的基准方向,以及该基准方向的边邻基准方向所对应的角度预测模式建立优化模式列表;获取目标编码块的相邻编码块中预设数量的最可能模式,并补入优化模式列表;根据优化模式列表中的率失真代价最小的模式作为帧内图像编码模式进行编码。本发明通过比对当前编码块与各基准方向上的方向编码块的相似度,进行帧内预测模式的选择以及优化模式列表的创建,减少由于全局模式决策带来的大量计算量,降低编码时间。
-
公开(公告)号:CN114445413B
公开(公告)日:2022-09-06
申请号:CN202210357799.4
申请日:2022-04-07
申请人: 宁波康达凯能医疗科技有限公司
摘要: 本发明公开了一种基于域自适应的帧间图像语义分割方法与系统,涉及图像处理技术领域,包括步骤:通过图像层级的域自适应处理训练图像,获得视觉风格优化后的增强图像;获取增强图像经过目标渲染处理后,带有相应语义标签的目标渲染图像;通过最小熵损失函数进行目标渲染图像与目标图像之间基于对抗学习的域间自适应训练;基于目标图像的熵图平均值进行有监督数据和无监督数据的提取;通过域间自适应训练后的模型结合有监督数据,与无监督数据进行基于熵的对抗学习,获取域内自适应后的语义分割模型。本发明通过增加图像层级的域自适应,降低视觉高维特征对输出空间的影响,通过三个层次域自适应的结合大大提高语义分割的精度。
-
公开(公告)号:CN114445413A
公开(公告)日:2022-05-06
申请号:CN202210357799.4
申请日:2022-04-07
申请人: 宁波康达凯能医疗科技有限公司
摘要: 本发明公开了一种基于域自适应的帧间图像语义分割方法与系统,涉及图像处理技术领域,包括步骤:通过图像层级的域自适应处理训练图像,获得视觉风格优化后的增强图像;获取增强图像经过目标渲染处理后,带有相应语义标签的目标渲染图像;通过最小熵损失函数进行目标渲染图像与目标图像之间基于对抗学习的域间自适应训练;基于目标图像的熵图平均值进行有监督数据和无监督数据的提取;通过域间自适应训练后的模型结合有监督数据,与无监督数据进行基于熵的对抗学习,获取域内自适应后的语义分割模型。本发明通过增加图像层级的域自适应,降低视觉高维特征对输出空间的影响,通过三个层次域自适应的结合大大提高语义分割的精度。
-
公开(公告)号:CN114513660B
公开(公告)日:2022-09-06
申请号:CN202210407485.0
申请日:2022-04-19
申请人: 宁波康达凯能医疗科技有限公司
IPC分类号: H04N19/109 , H04N19/192 , G06N3/04
摘要: 本发明公开了一种基于卷积神经网络的帧间图像模式决策方法,涉及图像处理技术领域,包括步骤:获取目标帧间图像执行合并模式后下一编码深度的编码图像和残差图像;以连接后的编码图像和残差图像作为输入信息,通过多层树CNN中的卷积层提取输入信息中的底层特征;通过多层树形CNN中预设层级数的残差层进行基于底层特征的逐层卷积;通过多层树形CNN中的全连接层进行各层卷积输出的全连接并获得目标帧间图像当前编码深度和分区划分下编码块的分区划分模式;根据各编码深度下各编码块的分区划分模式对目标帧间图像进行编码。本发明利用合并模式低编码比特率需求和卷积神经网络特征学习的优点,保持率失真性能的同时减少编码时间。
-
公开(公告)号:CN114584771A
公开(公告)日:2022-06-03
申请号:CN202210484181.4
申请日:2022-05-06
申请人: 宁波康达凯能医疗科技有限公司
IPC分类号: H04N19/119 , H04N19/147 , H04N19/593 , H04N19/70 , G06N20/10
摘要: 本发明公开了一种基于内容自适应的帧内图像编码单元划分方法与系统,涉及图像处理技术领域,包括步骤:获取各训练样本在率失真优化编码下的编码单元划分结果;提取训练样本中与编码单元划分相关的各样本的第一特征向量集,以及训练样本相邻编码单元中与编码单元划分相关的各样本的第二特征向量集;基于特征向量集和相应划分结果进行第一加权SVM分类器的训练;基于训练结果依次通过第一和第三加权SVM分类器进行预测样本的划分判断;根据预测样本在各编码深度下的划分结果进行帧内图像的划分。本发明通过获取帧内图像中各编码单元的划分决策,减少非必要编码深度下的划分计算,进而提高编码效率。
-
公开(公告)号:CN114513661A
公开(公告)日:2022-05-17
申请号:CN202210413096.9
申请日:2022-04-20
申请人: 宁波康达凯能医疗科技有限公司
IPC分类号: H04N19/11 , H04N19/147
摘要: 本发明公开了一种基于方向检测的帧内图像模式决策方法与系统,涉及图像处理技术领域,主要包括步骤:获取目标编码块分别与各基准方向上的方向编码块之间,编码块各对应位置处样本值的平方差之和;根据最小平方差之和所对应的基准方向,以及该基准方向的边邻基准方向所对应的角度预测模式建立优化模式列表;获取目标编码块的相邻编码块中预设数量的最可能模式,并补入优化模式列表;根据优化模式列表中的率失真代价最小的模式作为帧内图像编码模式进行编码。本发明通过比对当前编码块与各基准方向上的方向编码块的相似度,进行帧内预测模式的选择以及优化模式列表的创建,减少由于全局模式决策带来的大量计算量,降低编码时间。
-
公开(公告)号:CN114466199A
公开(公告)日:2022-05-10
申请号:CN202210376248.2
申请日:2022-04-12
申请人: 宁波康达凯能医疗科技有限公司
IPC分类号: H04N19/58
摘要: 本发明公开了一种可适用于VVC编码标准的参考帧生成方法与系统,涉及图像处理技术领域,包括步骤:提取帧缓冲区中以当前时刻为基准的目标区域内的参考帧作为训练集;通过训练集训练PredNet模型并更新模型的参数权重;获取输入当前时刻帧间图像至PredNet模型后所获得的优选参考帧;通过优选参考帧替换帧缓冲区中目标区域内的参考帧;通过运动估计帧缓冲区中目标区域内的参考帧获取当前时刻帧间图像的预测帧;基于当前时刻的预测帧和帧间图像执行视频解码过程中的运动补偿。本发明在利用帧缓冲区中参考帧进行运动补偿的过程中插入PredNet模型,使得帧缓冲区中的参考帧与当前帧的像素精确度更高,在使解码所需码率更低的同时,获得更高质量的解码图像。
-
公开(公告)号:CN114584771B
公开(公告)日:2022-09-06
申请号:CN202210484181.4
申请日:2022-05-06
申请人: 宁波康达凯能医疗科技有限公司
IPC分类号: H04N19/119 , H04N19/147 , H04N19/593 , H04N19/70 , G06N20/10
摘要: 本发明公开了一种基于内容自适应的帧内图像编码单元划分方法与系统,涉及图像处理技术领域,包括步骤:获取各训练样本在率失真优化编码下的编码单元划分结果;提取训练样本中与编码单元划分相关的各样本的第一特征向量集,以及训练样本相邻编码单元中与编码单元划分相关的各样本的第二特征向量集;基于特征向量集和相应划分结果进行第一加权SVM分类器的训练;基于训练结果依次通过第一和第三加权SVM分类器进行预测样本的划分判断;根据预测样本在各编码深度下的划分结果进行帧内图像的划分。本发明通过获取帧内图像中各编码单元的划分决策,减少非必要编码深度下的划分计算,进而提高编码效率。
-
公开(公告)号:CN114666590A
公开(公告)日:2022-06-24
申请号:CN202210574853.0
申请日:2022-05-25
申请人: 宁波康达凯能医疗科技有限公司
IPC分类号: H04N19/174 , H04N19/42 , H04N19/70 , G06K9/62 , G06V20/40 , G06F9/50 , G06V10/774 , G06V10/77
摘要: 本发明公开了一种基于负载均衡的全视场视频编码方法与系统,涉及图像处理技术领域,包括步骤:基于帧内图像编码要素提取帧内图像中存在的编码特征集;通过主成分分析对各编码特征进行线性变换,并提取特征协方差矩阵最大的主要特征集;提取训练视频序列中的主要特征集并以此通过极端随机树进行负载均衡为目标的切片划分训练;通过训练好的极端随机树对目标视频的帧内图像进行切片划分并编码。本发明通过帧内图像的数据级非均匀切片分割,进而在图像编码过程中使各处理器之间的负载均衡,在整体上减少了编码时间。
-
公开(公告)号:CN114584772A
公开(公告)日:2022-06-03
申请号:CN202210489206.X
申请日:2022-05-07
申请人: 宁波康达凯能医疗科技有限公司
IPC分类号: H04N19/124 , H04N19/154 , H04N19/503 , H04N19/70
摘要: 本发明公开了一种基于视觉注意力的全视场视频编码方法与系统,涉及图像处理技术领域,包括步骤:通过多面体投影获取全视场视频流中,帧间图像在各投影面对应视场下的二维映射帧;根据预设位序排列帧间图像各视场下的二维映射帧,并获取排列后时间序列上各帧间图像二维映射帧的帧序列;获取用户实时的视觉注意力图,并基于视觉注意力图中的感知权重调整各投影面对应视场下二维映射帧的实时量化参数;基于实时量化参数,对帧序列中各个位于同一视场相邻时间序列下的二维映射帧进行相对应的空间和时间上的帧间编码。本发明通过全视场视频编码过程中视觉注意图的加入和空间相关性的补足,在提高编码质量的情况下减少编码所需的比特率。
-
-
-
-
-
-
-
-
-