-
公开(公告)号:CN117915095A
公开(公告)日:2024-04-19
申请号:CN202410020227.6
申请日:2024-01-05
Applicant: 杭州电子科技大学
IPC: H04N19/147 , H04N19/436 , H04N19/124 , H04N19/146
Abstract: 本发明属于视频编码领域,涉及一种扫描线级加速并行RDOQ方法,采用SIMD指令,在预量化阶段同时对每个变换系数进行独立的预量化处理;在最优系数水平决策阶段,并行处理预量化后得到的量化系数,通过率失真优化来确定量化系数的最优值;在最后有效系数位置决策阶段,继续以并行处理的方式,同时基于贪婪策略获取到最优的最后有效系数位置。本发明的方法在保证编码性能损失较小的前提下,实现了RDOQ过程并行计算,且相比现有的并行RDOQ方法,本发明适用于硬件加速领域,基于贪婪算法实现LSC位置决策,创新度高,硬件吞吐量和编码性能有一个良好的折衷,为视频编码并行优化相关的算法研究提供了参考,具有重大意义。
-
公开(公告)号:CN116527910A
公开(公告)日:2023-08-01
申请号:CN202310422535.7
申请日:2023-04-11
Applicant: 杭州电子科技大学 , 浙江省经济信息中心(浙江省价格研究所)
IPC: H04N19/147 , H04N19/149 , H04N19/19 , H04N19/70
Abstract: 本发明属于AVS3视频编码领域,具体涉及一种基于扫描线并行的率失真优化量化方法,在完成预量化过程之后,采用列扫描顺序对预量化系数进行并行计算;每次计算多组预量化系数数据,在多组数据比较下确定最优量化系数;之后对非零位置进行并行决策,确定扫描线上最优非零位置。最后进行移位末位系数置零操作。本发明的方法在RDOQ中,提出了通过局部性优化,在符合zig‑zag扫描模式的情况下,可以进行并行处理,同时保留局部依赖。本发明在保证效果良好的前提下,减小了编码损失。
-
公开(公告)号:CN117041565A
公开(公告)日:2023-11-10
申请号:CN202310887654.X
申请日:2023-07-19
Applicant: 杭州电子科技大学 , 浙江省经济信息中心(浙江省价格研究所)
IPC: H04N19/11 , H04N19/186 , H04N19/176 , H04N19/593
Abstract: 本发明公开了一种AV1视频帧内粗模式决策优化及硬件架构方法,基于AV1对帧内模式决策优化,粗模式决策减少了计算时间,而计算复杂度上,将原来的61种决策情况分为两次进行,第一次选择13种模式进行;第二次选择6种模式进行决策;此外,不对矩形块的预测代价值做哈达玛变换,而是选择用基于4x4方块SATD值的叠加;在预测代价排序的选择上,选用双调排序,以适合发明所设计的并行架构;系统级优化方面,在每个方块处理流程上,采用流水线设计,缩小了硬件所需的面积资源,也加快了硬件实现的速度。
-
公开(公告)号:CN115131209B
公开(公告)日:2025-04-18
申请号:CN202210740614.8
申请日:2022-06-28
Applicant: 杭州电子科技大学
IPC: G06T3/4038 , G06T5/50 , G06V10/25 , G06V10/46 , G06V10/75
Abstract: 本发明属于图像处理领域,公开了一种基于DSP的实时视频拼接方法,采用select操作方式定向选择数据,借助gather和scatter指令将不连续RAM地址中的数据加载到向量寄存器中;图像配准算法部分:在匹配前设定阈值预筛选特征点,基于汉明距离进行特征点匹配。算法均使用SIMD指令集并行处理多数据,提高计算效率;采用PING‑PONG方式传输数据,旨在隐藏视频拼接过程中外部存储器访问的周期,从而有效提高数据吞吐量。最后,基于DAG生成算法调度表,在双DSP平台上并行执行ORB特征提取算法。本发明减少了计算复杂度;并为计算机视觉相关的算法在DSP平台上研究提供了参考。
-
公开(公告)号:CN115131209A
公开(公告)日:2022-09-30
申请号:CN202210740614.8
申请日:2022-06-28
Applicant: 杭州电子科技大学
Abstract: 本发明属于图像处理领域,公开了一种基于DSP的实时视频拼接方法,采用select操作方式定向选择数据,借助gather和scatter指令将不连续RAM地址中的数据加载到向量寄存器中;图像配准算法部分:在匹配前设定阈值预筛选特征点,基于汉明距离进行特征点匹配。算法均使用SIMD指令集并行处理多数据,提高计算效率;采用PING‑PONG方式传输数据,旨在隐藏视频拼接过程中外部存储器访问的周期,从而有效提高数据吞吐量。最后,基于DAG生成算法调度表,在双DSP平台上并行执行ORB特征提取算法。本发明减少了计算复杂度;并为计算机视觉相关的算法在DSP平台上研究提供了参考。
-
公开(公告)号:CN118158427A
公开(公告)日:2024-06-07
申请号:CN202410446677.1
申请日:2024-04-15
Applicant: 杭州电子科技大学 , 浙江省经济信息中心(浙江省价格研究所)
IPC: H04N19/42 , H04N19/174 , H04N19/182
Abstract: 本发明属于视频编码领域,公开了一种面向AV1调色板编码模式的高效k‑means聚类硬件架构及方法,本发明提出三条k‑means电路并行的架构,k‑means电路包括calc_indices和calc_centroids两个模块。calc_indices模块根据像素和簇中心的距离,来计算像素的索引,其中距离采用曼哈顿距离,索引值为像素和簇中心距离最小的簇编号。calc_centroids模块执行簇中心的更新,将索引值相同的像素累加并求平均值,作为下一次迭代的簇中心存储在C‑RAM中,本发明将不同块、同一块的k的聚类计算过程进行交织,从而提高硬件的利用率并减少取数次数。
-
公开(公告)号:CN117319654A
公开(公告)日:2023-12-29
申请号:CN202311392255.2
申请日:2023-10-25
Applicant: 杭州电子科技大学 , 浙江省经济信息中心(浙江省价格研究所)
IPC: H04N19/124 , H04N19/147 , H04N19/19 , H04N19/70
Abstract: 本发明属于视频编码领域,公开了一种基于扫描线并行RDOQ算法优化的硬件及流水实现方法,本发明在算法上将最优系数决策的之字形扫描线拆解成多个单向扫描线,以实现并行计算。在最优非零位置决策阶段,将迭代计算拆分成单条扫描线的并行计算,最后对各个扫描线上的最优位置进行RD cost的比较,在保证实时效果良好的前提下,减少迭代的周期,以满足视频编码处理的实时需求。本发明优化了传统的RD cost计算算法。Rate的强数据依赖使得运算须在单周期内完成,减少了硬件设计中运算的操作数量,节省了资源消耗。本发明充分利用Distortion无数据依赖的特性将运算拆分到多个流水线中,有效了提高硬件设计的时序表现。
-
-
-
-
-
-