-
公开(公告)号:CN118158427A
公开(公告)日:2024-06-07
申请号:CN202410446677.1
申请日:2024-04-15
Applicant: 杭州电子科技大学 , 浙江省经济信息中心(浙江省价格研究所)
IPC: H04N19/42 , H04N19/174 , H04N19/182
Abstract: 本发明属于视频编码领域,公开了一种面向AV1调色板编码模式的高效k‑means聚类硬件架构及方法,本发明提出三条k‑means电路并行的架构,k‑means电路包括calc_indices和calc_centroids两个模块。calc_indices模块根据像素和簇中心的距离,来计算像素的索引,其中距离采用曼哈顿距离,索引值为像素和簇中心距离最小的簇编号。calc_centroids模块执行簇中心的更新,将索引值相同的像素累加并求平均值,作为下一次迭代的簇中心存储在C‑RAM中,本发明将不同块、同一块的k的聚类计算过程进行交织,从而提高硬件的利用率并减少取数次数。
-
公开(公告)号:CN117319654A
公开(公告)日:2023-12-29
申请号:CN202311392255.2
申请日:2023-10-25
Applicant: 杭州电子科技大学 , 浙江省经济信息中心(浙江省价格研究所)
IPC: H04N19/124 , H04N19/147 , H04N19/19 , H04N19/70
Abstract: 本发明属于视频编码领域,公开了一种基于扫描线并行RDOQ算法优化的硬件及流水实现方法,本发明在算法上将最优系数决策的之字形扫描线拆解成多个单向扫描线,以实现并行计算。在最优非零位置决策阶段,将迭代计算拆分成单条扫描线的并行计算,最后对各个扫描线上的最优位置进行RD cost的比较,在保证实时效果良好的前提下,减少迭代的周期,以满足视频编码处理的实时需求。本发明优化了传统的RD cost计算算法。Rate的强数据依赖使得运算须在单周期内完成,减少了硬件设计中运算的操作数量,节省了资源消耗。本发明充分利用Distortion无数据依赖的特性将运算拆分到多个流水线中,有效了提高硬件设计的时序表现。
-
公开(公告)号:CN118018877A
公开(公告)日:2024-05-10
申请号:CN202410142890.3
申请日:2024-02-01
Applicant: 杭州电子科技大学 , 浙江省经济信息中心(浙江省价格研究所)
Abstract: 本发明属于脉冲数据处理技术领域,涉及一种面向脉冲相机的高效数据流处理方法,其编码端的数据压缩过程包括:步骤一,通过脉冲流分块模块将获取的原始脉冲流切割分块,得到原始脉冲块;步骤二,通过脉冲流凝聚模块压缩所述的原始脉冲块,得到压缩脉冲流;步骤三,将原始脉冲块和压缩脉冲流输入脉冲损失像素标记器,分析压缩造成的脉冲损失来进行信息补偿,后经像素级分类器输出量化二进制信息帧;步骤四,通过压缩脉冲‑信息整合器将压缩脉冲流、量化二进制信息帧和解码端的提示信息进行整合,生成最终的二进制数据流。相较于传统的脉冲压缩方案,本发明可以大大降低整个过程的复杂度,具有省时高效的优点。
-
公开(公告)号:CN117041565A
公开(公告)日:2023-11-10
申请号:CN202310887654.X
申请日:2023-07-19
Applicant: 杭州电子科技大学 , 浙江省经济信息中心(浙江省价格研究所)
IPC: H04N19/11 , H04N19/186 , H04N19/176 , H04N19/593
Abstract: 本发明公开了一种AV1视频帧内粗模式决策优化及硬件架构方法,基于AV1对帧内模式决策优化,粗模式决策减少了计算时间,而计算复杂度上,将原来的61种决策情况分为两次进行,第一次选择13种模式进行;第二次选择6种模式进行决策;此外,不对矩形块的预测代价值做哈达玛变换,而是选择用基于4x4方块SATD值的叠加;在预测代价排序的选择上,选用双调排序,以适合发明所设计的并行架构;系统级优化方面,在每个方块处理流程上,采用流水线设计,缩小了硬件所需的面积资源,也加快了硬件实现的速度。
-
公开(公告)号:CN116527910A
公开(公告)日:2023-08-01
申请号:CN202310422535.7
申请日:2023-04-11
Applicant: 杭州电子科技大学 , 浙江省经济信息中心(浙江省价格研究所)
IPC: H04N19/147 , H04N19/149 , H04N19/19 , H04N19/70
Abstract: 本发明属于AVS3视频编码领域,具体涉及一种基于扫描线并行的率失真优化量化方法,在完成预量化过程之后,采用列扫描顺序对预量化系数进行并行计算;每次计算多组预量化系数数据,在多组数据比较下确定最优量化系数;之后对非零位置进行并行决策,确定扫描线上最优非零位置。最后进行移位末位系数置零操作。本发明的方法在RDOQ中,提出了通过局部性优化,在符合zig‑zag扫描模式的情况下,可以进行并行处理,同时保留局部依赖。本发明在保证效果良好的前提下,减小了编码损失。
-
公开(公告)号:CN118972589A
公开(公告)日:2024-11-15
申请号:CN202411026348.8
申请日:2024-07-30
Applicant: 杭州电子科技大学
IPC: H04N19/129 , H04N19/13 , H04N19/134 , H04N19/21 , H04N19/176 , H04N19/119
Abstract: 本发明公开了基于扫描线并行熵编码二值化优化的硬件流水实现方法,通过获取单帧图像的系数数据,基于多个通道的扫描区域,对系数数据分块,用于多通道间并行执行分块的遍历;构建扩展数组和二维数组用于分块内的系数遍历,扩展数组中,存储上一分块的参考编码系数信息及当前分块的编码系数信息,二维数组中,第一维数组存储当前分块各编码系数信息,第二维数组存储各当前分块编码系数信息对应的在前参考编码系数信息;分块遍历时,根据上一次循环结束后数组的结果,预处理当前分块每个编码系数及其对应的在前参考编码系数,第二维数组用于计算标志位;遍历多个通道的所有分块,计算当前编码系数的标志位的上下文索引增量,将结果顺序输出。
-
公开(公告)号:CN110049338B
公开(公告)日:2023-04-18
申请号:CN201910344082.4
申请日:2019-04-26
Applicant: 杭州电子科技大学
IPC: H04N19/503 , H04N19/119 , H04N19/96 , H04N19/147 , H04N19/14 , H04N19/30 , H04N19/103
Abstract: 本发明公开了基于多层次分类的HEVC快速帧间编码方法。本发明包括运用CU层次的分类树、PU层次的分类树和TU层次的分类树实现HEVC快速帧间编码,其内容包括基于CU深度分类树的快速CU划分方法、基于帧间模式分类树的快速PU选择方法和基于TU深度分类树的TU划分方法。本发明利用了HEVC编码过程中CU深度、PU模式和TU深度在时空上的相似性,减少了CU划分的复杂度,简化了帧间预测模式的选择过程,同时利用TU的变换系数特征,降低了TU划分的复杂度。
-
公开(公告)号:CN115442620A
公开(公告)日:2022-12-06
申请号:CN202211095417.1
申请日:2022-09-06
Applicant: 杭州电子科技大学
IPC: H04N19/52 , H04N19/149 , H04N19/159 , H04N19/29 , H04N19/48
Abstract: 本发明属于视频编码领域,公开了一种AME低复杂度仿射运动估计方法,包括如下步骤:步骤1:基于划分深度的最优帧间模式的提前预测:根据父CU最优帧间模式来预测子CU最优帧间模式;步骤2:AME内部的低复杂度算法:在AME算法内部,通过CPMV平行与否、迭代过程的提前终止以及有无必要进行细粒度调整优化来加速AME算法;步骤3:AME外部的低复杂度算法:对于需要在传统Inter和AME之间进行模式决策的CU提取相关特征,基于决策树对这样的CU进行提前预测其最优帧间模式,以此跳过RDO决策及次优模式的遍历过程。本发明大大减少了VVC帧间模式决策复杂度。
-
公开(公告)号:CN115361557A
公开(公告)日:2022-11-18
申请号:CN202210992815.7
申请日:2022-08-18
Applicant: 杭州电子科技大学
IPC: H04N19/154 , H04N19/149 , H04N19/176 , H04N19/182 , H04N13/128 , H04N13/161
Abstract: 本发明方法公开了结合注意力机制的立体图像舒适度预测方法。本发明方法首先通过对输入的左、右视点图像分别进行半重叠采样,得到多个图像块对作为模型输入,分别得到低、中、高级特征的相加特征图和相减特征图;然后分别将低、中、高级特征的相加和相减特征图拼接成新的特征块,输入并行双注意力模块进行注意力加权;将低、中、高级特征的通道和空间注意力加权特征拼接成新的特征块,并分别输入对应的次要子网络,最终得到三个次要子网络的输出特征向量,合并三个次要子网络的输出特征向量,并输入用于回归预测的全连接层网络进行舒适度回归预测。本发明方法不仅降低了流程复杂度,还规避了因视差计算不准确带来的影响。
-
公开(公告)号:CN114445618A
公开(公告)日:2022-05-06
申请号:CN202111665038.7
申请日:2021-12-31
Applicant: 杭州电子科技大学
IPC: G06V10/25
Abstract: 本发明方法公开了一种跨模态交互RGB‑D图像显著区域检测方法。本发明方法首先分别从彩色图和深度图中利用VGG16网络提取RGB特征和深度特征;然后在RGB‑D交互模块中RGB特征和深度特征相互纠正,并增强边缘细节;深度权重分配模块中根据深度特征计算处理后的多个特征的融合权重;最后在注意力更新模块中细化融合后的特征。本发明方法将RGB与深度联系起来,通过补充丰富的边界信息来增强目标区域;在多尺度深度权重模块中计算权重,根据深度图的质量来决定其对显著区域的影响程度,消除了低质量深度图带来的负面影响,并提升算法的整体性能。本发明方法可以直接应用在3D图像处理,3D质量评估以及物体识别等工程领域中。
-
-
-
-
-
-
-
-
-